Análisis de texto clínico en español mediante arquitecturas de aprendizaje profundo para el diagnóstico automático de enfermedades respiratorias

Moreno Lara, Quenira Jaanai

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/112605

Título:	Análisis de texto clínico en español mediante arquitecturas de aprendizaje profundo para el diagnóstico automático de enfermedades respiratorias
Autor:	Moreno Lara, Quenira Jaanai
Director:	Torres Ramos, Sulema
Palabras clave:	Tromboembolia Pulmonar;Neumonia;Procesamiento Del Lenguaje Natural;Modelos Transformer
Fecha de titulación:	13-mar-2026
Editorial:	Biblioteca Digital wdg.biblio Universidad de Guadalajara
Resumen:	La tromboembolia pulmonar y la neumonía representan dos afecciones cuya interacción clínica y epidemiológica evidencia la complejidad del diagnóstico respiratorio. Dado su impacto clínico, un diagnóstico preciso y oportuno es fundamental. En este contexto, las notas clínicas electrónicas, redactadas en formato libre, constituyen una fuente valiosa de información que puede fortalecer la toma de decisiones médicas y reducir diagnósticos tardíos o incorrectos. Para convertir estos datos no estructurados en conocimiento útil, el Procesamiento del Lenguaje Natural (PLN) desempeña un papel clave. Este trabajo demuestra que la aplicación de modelos de lenguaje basados en arquitecturas Transformer y especializados en el dominio biomédico-clínico en español permite abordar de manera efectiva la clasificación automática del diagnóstico diferencial entre tromboembolia pulmonar y neumonía a partir de narrativas clínicas. En particular, se identificaron cuatro hallazgos principales. Primero, los modelos especializados en el dominio biomédico-clínico mostraron un desempeño superior al modelo multilingüe de propósito general, alcanzando mayores niveles de exactitud y un balance más consistente entre sensibilidad y especificidad, lo que respalda la importancia del alineamiento entre el preentrenamiento, el idioma y el dominio clínico de la tarea. Segundo, la sección clínica utilizada como entrada fue determinante: la sección con mayor riqueza narrativa y relevancia diagnóstica concentró los mejores resultados, mientras que la sección más breve y menos específica aportó información más limitada; además, la integración de secciones no produjo mejoras sistemáticas cuando la información adicional no aportó evidencia clínica verdaderamente complementaria. Tercero, ampliar la ventana de contexto no garantizó un mejor desempeño global y supuso un mayor costo computacional; no obstante, el modelo de contexto largo mostró un comportamiento más estable frente a variaciones en la sección clínica y la estrategia de representación. Cuarto, la estrategia de representación basada en la agregación de información a lo largo del documento resultó más consistente que depender exclusivamente de un único vector resumen. Como limitaciones, se identifican el costo computacional asociado al ajuste fino y a la optimización de hiperparámetros, así como retos relacionados con la generalización a otros contextos clínicos y la interpretabilidad de los modelos. En conjunto, este trabajo contribuye metodológicamente al desarrollo del PLN clínico en español y sienta bases para el desarrollo de herramientas computacionales orientadas al apoyo del diagnóstico diferencial.
URI:	https://wdg.biblio.udg.mx https://hdl.handle.net/20.500.12104/112605
Programa educativo:	MAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE
Aparece en las colecciones:	CUCEI

Ficheros en este ítem:

Fichero	Tamaño	Formato
MCUCEI11298FT.pdf	5.66 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem