Mostrar el registro sencillo del ítem
Desarrollo de un Modelo de Inteligencia Artificial para Predecir la Deserción de estudiantes de sistemas en las Unidades Tecnológicas de Santander (2017-2024)
| dc.rights.license | abierto | es_ES |
| dc.contributor.advisor | Parra Correa, Oscar Mauricio | |
| dc.contributor.author | Suárez González, Daniel José | |
| dc.contributor.author | Castaño Grueso, Luis Manuel | |
| dc.contributor.other | Castellanos Rodríguez, Liz Katherinne | |
| dc.date.accessioned | 2026-05-29T18:52:01Z | |
| dc.date.available | 2026-05-29T18:52:01Z | |
| dc.identifier.citation | N/A | es_ES |
| dc.identifier.uri | http://repositorio.uts.edu.co:8080/xmlui/handle/123456789/23908 | |
| dc.description | Deserción estudiantil, inteligencia artificial, machine learning, análisis de datos, educación superior. | es_ES |
| dc.description.abstract | RESUMEN EJECUTIVO La deserción estudiantil en la educación superior constituye una problemática persistente en Colombia, con impactos académicos, sociales y económicos significativos, especialmente en programas de alta exigencia como Ingeniería de Sistemas. En las Unidades Tecnológicas de Santander (UTS), la identificación de estudiantes en riesgo de deserción se realiza, en la mayoría de los casos, de manera tardía, lo que limita la efectividad de las estrategias de acompañamiento institucional. El presente trabajo de grado tiene como objetivo desarrollar un modelo predictivo basado en técnicas de inteligencia artificial que permita estimar el riesgo de deserción de estudiantes de nuevo ingreso en el programa de Ingeniería de Sistemas de las UTS, utilizando datos históricos correspondientes al periodo 2017–2024. La investigación adopta un enfoque cuantitativo y descriptivo–correlacional, apoyado en el análisis de datos académicos, socioeconómicos e institucionales previamente anonimizados. Metodológicamente, se construyó un dataset estructurado y depurado, el cual fue utilizado para entrenar y validar un modelo de machine learning, específicamente una red neuronal. El desempeño del modelo se evaluó mediante métricas como precisión, recall, F1-score y área bajo la curva (AUC), con el fin de garantizar una predicción confiable y minimizar sesgos en los resultados. Adicionalmente, se diseñó una interfaz gráfica que permite a los administradores académicos ingresar datos de nuevos estudiantes y visualizar de manera clara el nivel de riesgo de deserción. Como resultado, se obtuvo un modelo predictivo funcional capaz de identificar tempranamente estudiantes en riesgo, facilitando la toma de decisiones y la implementación de acciones preventivas por parte de la institución. Este trabajo contribuye al fortalecimiento de la gestión académica en las UTS, promoviendo estrategias de permanencia estudiantil basadas en el uso responsable de la inteligencia artificial. | es_ES |
| dc.description.sponsorship | N/A | es_ES |
| dc.description.tableofcontents | TABLA DE CONTENIDO RESUMEN EJECUTIVO 11 INTRODUCCIÓN 13 1. DESCRIPCIÓN DEL TRABAJO DE INVESTIGACIÓN 15 1.1. PLANTEAMIENTO DEL PROBLEMA 15 1.2. JUSTIFICACIÓN 16 1.3. OBJETIVOS 17 1.3.1. OBJETIVO GENERAL 17 1.3.2. OBJETIVOS ESPECÍFICOS 17 1.4. ESTADO DEL ARTE 18 1.4.1. REFERENCIAS INTERNACIONALES 18 1.4.2. REFERENCIAS LOCALES 22 1.4.3. REFERENCIAS REGIONALES 25 2. MARCO REFERENCIAL 27 2.1. MARCO CONCEPTUAL. 27 2.1.1. DESERCIÓN ESTUDIANTIL 27 2.1.2. INTELIGENCIA ARTIFICIAL 28 2.1.3. MACHINE LEARNING 29 2.1.4. ANÁLISIS DE DATOS 29 2.1.5. DATASET 30 2.1.6. PRECISIÓN (ACCURACY) 30 2.1.7. RECALL (SENSIBILIDAD) 30 2.1.8. F1-SCORE 30 2.2. MARCO TEÓRICO. 31 2.2.1. MODELO DE INTEGRACIÓN ACADÉMICA Y SOCIAL 31 2.2.2. MODELO DE PERSISTENCIA ESTUDIANTIL 32 2.2.3. ENFOQUE SOCIOECONÓMICO 32 2.2.4. ENFOQUE PSICOLÓGICO Y MOTIVACIONAL 33 2.3. MARCO LEGAL. 34 2.3.1. NORMATIVA EDUCATIVA COLOMBIANA 34 2.3.2. NORMATIVA SOBRE PROTECCIÓN DE DATOS PERSONALES 36 2.3.3. CUMPLIMIENTO NORMATIVO EN LA PRESENTE INVESTIGACIÓN 38 3. DISEÑO DE LA INVESTIGACIÓN 38 3.1. TIPO DE INVESTIGACIÓN 39 3.2. ENFOQUE DE LA INVESTIGACIÓN 39 3.3. MÉTODO DE INVESTIGACIÓN 39 3.4. TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS 40 3.5. POBLACIÓN Y MUESTRA 40 3.6. PROCEDIMIENTO O FASES DE LA INVESTIGACIÓN 41 4. DESARROLLO DEL TRABAJO DE GRADO 42 4.1. METODOLOGÍA DE DESARROLLO DE SOFTWARE 42 4.2. ESPECIFICACIÓN DE REQUISITOS DEL SISTEMA 43 4.2.1. REQUISITOS FUNCIONALES 44 4.2.2. REQUISITOS NO FUNCIONALES 46 4.3. RECOLECCIÓN Y PREPARACIÓN DE LOS DATOS 48 4.3.1. DESCRIPCIÓN DEL CONTENIDO DE LA BASE DE DATOS 49 4.3.2. LIMPIEZA INICIAL Y DEPURACIÓN DEL CONJUNTO DE DATOS 52 4.4. CONFIGURACIÓN DEL ENTORNO DE DESARROLLO 55 4.4.1. VERSIÓN DE PYTHON Y ENTORNO VIRTUAL 55 4.4.2. INSTALACIÓN DE DEPENDENCIAS 57 4.4.3. EJECUCIÓN DEL PROYECTO 58 4.5. DISEÑO Y ENTRENAMIENTO DEL MODELO 61 4.5.1. ESTRUCTURA GENERAL DEL MODELO 61 4.5.2. CARGA DEL ARCHIVO Y ELIMINACIÓN DE COLUMNAS NO PERTINENTES 65 4.5.3. TRANSFORMACIÓN DE VARIABLES TEMPORALES 67 4.5.4. FILTRADO POR PROGRAMA ACADÉMICO Y RECODIFICACIÓN DE LA VARIABLE OBJETIVO 68 4.5.5. RECODIFICACIÓN DE VARIABLES CATEGÓRICAS ORDINALES Y CODIFICACIÓN ONE-HOT 69 4.5.6. PARTICIÓN DEL CONJUNTO DE DATOS Y ESCALAMIENTO 70 4.5.7. PESOS DE CLASE PARA MANEJO DEL DESBALANCE 72 4.5.8. ARQUITECTURA DE LA RED NEURONAL 73 4.5.9. COMPILACIÓN, CALLBACKS Y ENTRENAMIENTO 75 4.5.10. EVALUACIÓN DEL MODELO Y GUARDADO 77 4.6. IMPLEMENTACIÓN DE LA INTERFAZ DE USUARIO (APLICACIÓN WEB) 78 4.6.1. DESCRIPCIÓN GENERAL DE LA APLICACIÓN 78 4.6.2. MÓDULO DE LIMPIEZA INTEGRADO EN LA APLICACIÓN 79 4.6.3. ESTRUCTURA Y FUNCIONALIDADES DE LA INTERFAZ 80 5. RESULTADOS ¡ERROR! MARCADOR NO DEFINIDO. 5.1. RESULTADOS GLOBALES DE CLASIFICACIÓN 83 5.2. ENTRADA DE SISTEMA 84 5.2.1. VARIABLES ACADÉMICAS DEL ESTUDIANTE 85 5.2.2. VARIABLES DEMOGRÁFICAS O CONTEXTUALES 85 5.2.3. PARÁMETRO DE DECISIÓN CONFIGURADO POR EL USUARIO 86 5.2.4. CONJUNTO DE DATOS A EVALUAR 86 5.3. SALIDAS DEL SISTEMA 86 5.3.1. PROBABILIDAD INDIVIDUAL DE APROBACIÓN ACADÉMICA 87 5.3.2. CLASIFICACIÓN DE RIESGO ACADÉMICO 87 5.3.3. RESULTADOS AGREGADOS DE LA POBLACIÓN EVALUADA 87 5.3.4. ESTADÍSTICAS DESCRIPTIVAS DE LAS PROBABILIDADES 87 5.3.5. BASE DE RESULTADOS EXPORTABLE 88 5.3.6. UMBRALES ALTOS (0,80 – 0,90) 89 5.3.7. UMBRALES INTERMEDIOS (0,45 – 0,55) 90 5.3.8. UMBRALES BAJOS (0,3 – 0,4) 90 5.3.9. JUSTIFICACIÓN DEL UMBRAL SELECCIONADO 90 5.4. ANÁLISIS DEL ÉXITO DEL SISTEMA 92 5.4.1. ANÁLISIS DE LA DISTRIBUCIÓN PROBABILÍSTICA 93 5.5. INTERPRETACIÓN TÉCNICA 94 6. CONCLUSIONES 95 7. RECOMENDACIONES 98 8. BIBLIOGRAFÍA 101 9. ANEXOS 107 9.1. MANUAL DE USUARIO DE LA APLICACIÓN WEB 107 9.1.1. PRUEBAS CON DATOS PRE-PANDEMIA (2017–2019) 111 9.2. PRUEBAS CON DATOS DURANTE PANDEMIA (2020–2021) 112 9.3. PRUEBAS CON DATOS POST-PANDEMIA (2022–2024) 112 | es_ES |
| dc.publisher | UTS | es_ES |
| dc.subject | Deserción estudiantil, inteligencia artificial, machine learning, análisis de datos, educación superior. | es_ES |
| dc.title | Desarrollo de un Modelo de Inteligencia Artificial para Predecir la Deserción de estudiantes de sistemas en las Unidades Tecnológicas de Santander (2017-2024) | es_ES |
| dc.type | degree work | es_ES |
| dc.rights.holder | CC | es_ES |
| dc.date.emitido | 2026-05-05 | |
| dc.dependencia | fcni | es_ES |
| dc.proceso.procesouts | investigacion | es_ES |
| dc.type.modalidad | desarrollo_tecnológico | es_ES |
| dc.format.formato | es_ES | |
| dc.titulog | Ingeniero de Sistemas | es_ES |
| dc.educationlevel | Profesional | es_ES |
| dc.contibutor.evaluator | evaluador | es_ES |
| dc.date.aprobacion | 2026-05-12 | |
| dc.description.programaacademico | Ingeniería de Sistemas | es_ES |
| dc.dependencia.region | bucaramanga | es_ES |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
Proyectos de Investigación
Trabajos de Grado en modalidad DTeI, monografía, Investigación