Uso de Técnicas de machine learning para la clasificación de imágenes de danzas típicas del Cusco
Abstract
Cusco es una de las ciudades del mundo con mayor presencia de danzas autóctonas. Cada año, antropólogos folkloristas encuentran más información sobre las danzas y así rescatan parte de nuestra cultura. Sólo en las festividades podemos ubicar al menos 4 danzas típicas muy comunes: Qhapaq Qolla, Qhapaq Chuncho, Negrillo, y Contradanza. Por otro lado, Cusco también es conocido como una de las ciudades más turísticas del mundo y con todo el avance tecnológico que se viene dando, ahora es más fácil tomar fotografías y así preservar diversos eventos. Por lo tanto, se cuenta con mucha información visual que no es procesada. Computacionalmente hablando, se puede lidiar con este problema mediante la clasificación automática de imágenes. La aplicación de este problema puede ser visto en diferentes áreas como Sistemas de vigilancia, sistemas de recuperación, compresión, segmentación de imágenes, y muchos otras más. La clasificación de imágenes también representa un gran desafío debido a los problemas en iluminación, rotación, escala, oclusión o variación de puntos de vista. Actualmente, los trabajos en clasificación de danzas se enfocan en videos, sin embargo, en imágenes este problema está muy poco estudiado. Los trabajos más relacionados que usan imágenes buscan clasificar eventos culturales; a diferencia de éstos, la información contextual de la imagen no juega un papel relevante como para los eventos culturales. Este trabajo busca clasificar imágenes de danzas típicas del Cusco, el problema se torna particularmente interesante debido a que además de los problemas ya mostrados, se debe trabajar sobre la figura humana. El método planteado fue dividido en dos etapas, en la primera se localiza al danzante dentro de la imagen mediante la detección de máscaras usando Histogram of Oriented Gradient y técnicas de detección de rostros, y en la segunda se realiza la clasificación mediante Bag-of-Words. El principal aporte de este trabajo es realizar un estudio del desempeño de técnicas de Machine Learning en la clasificación de imágenes de danzas, igualmente se creó un dataset con imágenes etiquetadas de las danzas de la región que fueron de interés para el trabajo. Cabe recalcar que este dataset es el primero de su tipo y que será puesto de manera abierta a la comunidad científica para aportar al estado-del-arte. Los resultados obtenidos muestran una tasa de acierto alta para éste problema.
Collections
- Tesis [91]