Show simple item record

dc.contributor.advisorOrmeño Ayala, Yeshica Isela
dc.contributor.authorCarbajal Bacilio, Karen Alexsandra
dc.contributor.authorSuarez Mariscal, Claudia Francesca
dc.date.accessioned2023-07-06T16:49:28Z
dc.date.available2023-07-06T16:49:28Z
dc.date.issued2023
dc.identifier.other253T20230164
dc.identifier.urihttp://hdl.handle.net/20.500.12918/7478
dc.description.abstractEl objetivo de esta investigación se centra en evaluar el etiquetado de tweets mediante Pysentimiento, un modelo transformer especializado para el análisis de texto, y posteriormente utilizar este dataset para entrenar modelos de aprendizaje supervisado no especializados en la tarea del análisis de sentimiento. Para ello se propone la construcción de dos datasets, de escenario político y pandemia, mediante una metodología que incluye a Twint, para la extracción de tweets, y a Pysentimiento, para etiquetar los datos automáticamente. También se incluye una etapa de verificación manual de una porción de los datos, para evaluar el impacto de contar con datos etiquetados manualmente en la fase de entrenamiento de los modelos. En tanto para realizar el análisis de sentimientos, los datos son pre-procesados y transformados previamente a la aplicación de cuatro modelos clasificadores de Machine Learning(ML): Naive Bayes (NB), Super Vector Machine (SVM), Random Forest (RF) y Multilayer Perceptron (MLP). Así mismo se propone una fase experimental para aumentar el rendimiento de estos modelos, de los cuales se obtiene que: (1) se debe trabajar basado en el análisis de las clase positiva y negativa (de acuerdo a los datasets obtenidos) con una proporción estratificada para el train/test, (2) la verificación manual mejora los resultados para ambos escenarios, (3) Naive Bayes es el mejor clasificador con 88,4 % de exactitud, 83,4 % de precisión, 89,8 % de exhaustividad y 86,5 % de F1-score, mientras que para el escenario pandemia Super Vector Machine es considerado como el mejor clasificador con 85 % de exactitud, 86,1 % de precisión, 77,8 % de exhaustividad y 81,7 % de F1-score.es_PE
dc.description.sponsorshipUNSAAC - CONCYTEC - FONDECYT
dc.formatapplication/pdfen_US
dc.language.isospaes_PE
dc.publisherUniversidad Nacional de San Antonio Abad del Cuscoes_PE
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectAnálisis de sentimientoses_PE
dc.subjectTwintes_PE
dc.subjectPysentimientoes_PE
dc.subjectNaive Bayeses_PE
dc.subjectSuper Vector Machinees_PE
dc.subjectRandom Forestes_PE
dc.subjectMultilayer Perceptrones_PE
dc.titleImplementación de un dataset para la evaluación de modelos de análisis de sentimientos en la clasificación de tweetses_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
thesis.degree.nameIngeniero Informático y de Sistemas
thesis.degree.grantorUniversidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y Mecánica
thesis.degree.disciplineIngeniería Informática y de Sistemas
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#2.02.04
renati.author.dni75725852
renati.author.dni72194246
renati.advisor.orcidhttps://orcid.org/0000-0002-5497-6928
renati.advisor.dni25002834
renati.typehttp://purl.org/pe-repo/renati/type#tesis
renati.levelhttp://purl.org/pe-repo/renati/nivel#tituloProfesional
renati.discipline612296
renati.jurorCarbajal Luna, Julio Cesar
renati.jurorGamarra Saldivar, Enrique
renati.jurorCandia Oviedo, Dennis Ivan
renati.jurorPalma Ttito, Luis Beltran
dc.publisher.countryPE


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess