Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12104/112605Registro completo de metadatos
| Campo DC | Valor | Lengua/Idioma |
|---|---|---|
| dc.contributor.author | Moreno Lara, Quenira Jaanai | |
| dc.date.accessioned | 2026-04-13T19:54:27Z | - |
| dc.date.available | 2026-04-13T19:54:27Z | - |
| dc.date.issued | 2026-03-13 | |
| dc.identifier.uri | https://wdg.biblio.udg.mx | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12104/112605 | - |
| dc.description.abstract | La tromboembolia pulmonar y la neumonía representan dos afecciones cuya interacción clínica y epidemiológica evidencia la complejidad del diagnóstico respiratorio. Dado su impacto clínico, un diagnóstico preciso y oportuno es fundamental. En este contexto, las notas clínicas electrónicas, redactadas en formato libre, constituyen una fuente valiosa de información que puede fortalecer la toma de decisiones médicas y reducir diagnósticos tardíos o incorrectos. Para convertir estos datos no estructurados en conocimiento útil, el Procesamiento del Lenguaje Natural (PLN) desempeña un papel clave. Este trabajo demuestra que la aplicación de modelos de lenguaje basados en arquitecturas Transformer y especializados en el dominio biomédico-clínico en español permite abordar de manera efectiva la clasificación automática del diagnóstico diferencial entre tromboembolia pulmonar y neumonía a partir de narrativas clínicas. En particular, se identificaron cuatro hallazgos principales. Primero, los modelos especializados en el dominio biomédico-clínico mostraron un desempeño superior al modelo multilingüe de propósito general, alcanzando mayores niveles de exactitud y un balance más consistente entre sensibilidad y especificidad, lo que respalda la importancia del alineamiento entre el preentrenamiento, el idioma y el dominio clínico de la tarea. Segundo, la sección clínica utilizada como entrada fue determinante: la sección con mayor riqueza narrativa y relevancia diagnóstica concentró los mejores resultados, mientras que la sección más breve y menos específica aportó información más limitada; además, la integración de secciones no produjo mejoras sistemáticas cuando la información adicional no aportó evidencia clínica verdaderamente complementaria. Tercero, ampliar la ventana de contexto no garantizó un mejor desempeño global y supuso un mayor costo computacional; no obstante, el modelo de contexto largo mostró un comportamiento más estable frente a variaciones en la sección clínica y la estrategia de representación. Cuarto, la estrategia de representación basada en la agregación de información a lo largo del documento resultó más consistente que depender exclusivamente de un único vector resumen. Como limitaciones, se identifican el costo computacional asociado al ajuste fino y a la optimización de hiperparámetros, así como retos relacionados con la generalización a otros contextos clínicos y la interpretabilidad de los modelos. En conjunto, este trabajo contribuye metodológicamente al desarrollo del PLN clínico en español y sienta bases para el desarrollo de herramientas computacionales orientadas al apoyo del diagnóstico diferencial. | |
| dc.description.tableofcontents | Índice Lista de Figuras vi Lista de Tablas vii Lista de Acrónimos viii Capítulo 1 Introducción 1 1.1 Antecedentes 1 1.2 Estado del Arte 3 1.3 Planteamiento del Problema 5 1.4 Justificación 6 1.5 Hipótesis 6 1.6 Objetivos 7 1.6.1 Objetivo General 7 1.6.2 Objetivos Específicos 7 Capítulo 2 Marco Teórico 8 2.1 Detección de Enfermedades Respiratorias 8 2.1.1 Tromboembolia Pulmonar 8 2.1.2 Neumonía 10 2.1.3 Problema de Diagnóstico Clínico de TEPyN 11 2.1.4 Expediente Clínico Electrónico 12 2.2 Procesamiento del Lenguaje Natural 12 2.2.1 Tareas Principales en Procesamiento del Lenguaje Natural 13 2.2.2 Procesamiento del Lenguaje Natural Aplicado al Ámbito Clínico 14 2.3 Aprendizaje Automático 15 2.3.1 Redes Neuronales Artificiales 17 2.4 Aprendizaje Profundo 18 iv 2.4.1 Redes Neuronales Convolucionales 19 2.4.2 Redes Neuronales Recurrentes 20 2.4.3 Red Neuronal de Memoria a Corto y Largo Plazo 22 2.4.4 Vectores de Palabra 25 2.4.5 Métricas de Evaluación en Clasificación 31 Capítulo 3 Metodología 35 3.1 Panorama General 35 3.2 Descripción del Conjunto de Notas Clínicas 36 3.3 Preparación de las Notas Clínicas 36 3.3.1 Extracción de Textos Clínicos 36 3.3.2 Selección de Secciones Relevantes 40 3.3.3 Configuración de los Experimentos 41 3.4 Pre-procesamiento del Texto 41 3.4.1 Tokenización, Truncamiento y Relleno 42 3.5 Clasificación Diagnóstica 43 3.5.1 Ajuste Fino de Modelos de Lenguaje Preentrenados 43 3.5.2 Definición de Estrategias de Representación 44 3.5.3 Diseño de la Capa de Clasificación 45 3.6 Evaluación del Diagnóstico 47 3.6.1 Medición del Desempeño de Clasificación 47 Capítulo 4 Resultados y Discusión 48 4.1 Marco General de los Resultados Experimentales 48 4.2 Desempeño de los Modelos de Lenguaje Preentrenados 48 4.2.1 Modelo de Lenguaje General Multilingüe 50 4.2.2 Modelo de Lenguaje en Español Biomédico-clínico 52 4.2.3 Modelo de Lenguaje en Español Biomédico-clínico para Documentos Extensos 53 4.3 Discusión 55 4.3.1 Comparación con el Estado del Arte 57 v Capítulo 5 Conclusiones y Trabajo Futuro 59 5.1 Conclusiones 59 5.2 Limitaciones y Trabajo Futuro 60 5.3 Productos Derivados 61 Referencias 62 Anexos Anexo A 72 Anexo B 73 Anexo C 74 | |
| dc.format | application/PDF | |
| dc.language.iso | spa | |
| dc.publisher | Biblioteca Digital wdg.biblio | |
| dc.publisher | Universidad de Guadalajara | |
| dc.rights.uri | https://www.riudg.udg.mx/info/politicas.jsp | |
| dc.subject | Tromboembolia Pulmonar | |
| dc.subject | Neumonia | |
| dc.subject | Procesamiento Del Lenguaje Natural | |
| dc.subject | Modelos Transformer | |
| dc.title | Análisis de texto clínico en español mediante arquitecturas de aprendizaje profundo para el diagnóstico automático de enfermedades respiratorias | |
| dc.type | Tesis de Maestría | |
| dc.rights.holder | Universidad de Guadalajara | |
| dc.rights.holder | Moreno Lara, Quenira Jaanai | |
| dc.coverage | GUADALAJARA, JALISCO | |
| dc.type.conacyt | masterThesis | |
| dc.degree.name | MAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE | |
| dc.degree.department | CUCEI | |
| dc.degree.grantor | Universidad de Guadalajara | |
| dc.rights.access | openAccess | |
| dc.degree.creator | MAESTRIA EN CIENCIAS EN BIOINGENIERO EN Y COMPUTO INTELIGENTE | |
| dc.contributor.director | Torres Ramos, Sulema | |
| dc.contributor.codirector | Román Godínez, Israel | |
| Aparece en las colecciones: | CUCEI | |
Ficheros en este ítem:
| Fichero | Tamaño | Formato | |
|---|---|---|---|
| MCUCEI11298FT.pdf | 5.66 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.