Análisis de clúster para la segmentación de pacientes con diabetes mellitus tipo 2 mediante el algoritmo Fuzzy C - Means en el Cusco, 2019 - 2022
Resumen
El presente estudio consiste en segmentar clínicamente a pacientes con diabetes mellitus tipo 2, registrados en la DIRESA Cusco durante el periodo 2019-2022, mediante la aplicación del algoritmo de agrupamiento difuso Fuzzy C-Means. Para ello, se depuró una base de datos conformada por 2750 pacientes, seleccionando cinco variables de mayor relevancia clínica: edad, índice de masa corporal (IMC), presión arterial sistólica, presión arterial diastólica y nivel de glicemia. Se excluyeron variables sin utilidad clínica, con altos porcentajes de datos faltantes o con colinealidad elevada. El análisis se desarrolló en el lenguaje de programación R, donde se estandarizaron las variables y se aplicaron índices de validación interna para determinar el número óptimo de clústeres, estableciéndose cuatro segmentos clínicamente diferenciados. Los resultados evidencian la capacidad del algoritmo para capturar la heterogeneidad de la población estudiada, permitiendo identificar tanto perfiles específicos como pacientes con pertenencia difusa entre clústeres, los cuales podrían representan estados transicionales de la enfermedad. Se concluye que el enfoque basado en agrupamiento difuso representa una herramienta estadística eficaz para la segmentación clínica de pacientes, con potencial para orientar intervenciones más focalizadas y contribuir a una mejor planificación sanitaria basada en datos a nivel regional.
Colecciones
- Tesis [58]