Comparación de técnicas de imputación de datos de ictericia patológica de niños atendidos en el hospital Regional de Cusco, 2021
Abstract
La presente investigación es básica descriptiva, con un enfoque cuantitativo con diseño no experimental donde la unidad de análisis son los pacientes infantes del Hospital Regional del Cusco, el propósito de la presente investigación fue el de determinar cuál es la técnica de imputación de datos que mejor desempeño presenta la muestra estuvo conformado por 656 registros de historias de los pacientes infantes del Hospital Regional del Cusco-2021, donde la técnica de recolección de datos e información fue la revisión documental, en específico revisión de historias clínicas. Para el análisis se utilizó metodologías de completar datos, como completar con la mediana, completar con regresión utilizando predictores y ruidos aleatorios gaussianos, además de la metodología de KNN k vecinos más cercanos, todos ellos implementados en el software libre R y Restudio; así mismo para ver cuáles son los factores con mayor riesgo en el tipo de ictericia se usará la regresión logística de manera superficial como una complementariedad al trabajo de investigación. Las conclusiones a los que se abordaron con la investigación fueron; la imputación de datos de la variable peso en el alta médica del Recién Nacido en términos de la media la técnica que tiene mayor acercamiento es KNN vecinos más cercanos, mientras que en la variable hematocrito en términos de la media, la técnica que tiene mayor acercamiento es la de Regresión con ruido aleatorio; En general las técnicas basadas en regresión presentan mejor performance a la hora de imputar datos faltantes, como es el caso de la presente investigación.
Collections
- Tesis [49]