top of page
Buscar
  • Foto del escritorCarlos A. Almenara

Modelado de tópicos mediante el procesamiento del lenguaje natural y el aprendizaje automático

En 2020, durante el confinamiento por el COVID-19, tuve la oportunidad de analizar 7899 resúmenes de artículos de revistas especializadas en trastornos alimentarios. Empleé bibliometría, análisis de redes y modelado de tópicos.


Hoy me gustaría compartir algunos resultados interesantes: los temas encontrados y las tendencias de estos en un periodo de 40 años (véase la Figura más abajo).


Los análisis los realicé con Python. En primer lugar, fue necesario aplicar algunas técnicas de procesamiento del lenguaje natural (PLN) para limpiar y preprocesar los datos. A continuación, utilicé el aprendizaje automático (machine learning) para extraer los temas. Concretamente, empleé una combinación de TF-IDF (frecuencia de términos-frecuencia inversa de documentos) con NMF o NNMF (factorización de matrices no negativas).


Como se puede ver a continuación, se extrajeron un total de 10 temas (los temas se etiquetaron manualmente):


Tema 1 - Factores de riesgo de los trastornos alimentarios (2809 documentos)

Tema 2 - Insatisfacción con la imagen corporal (1136 documentos)

Tema 3 - Diagnóstico del trastorno por atracón (928 documentos)

Tema 4 - Pérdida de peso, control de peso y dieta (735 documentos)

Tema 5 - Grupos clínicos (671 documentos)

Tema 6 - Resultados del tratamiento (379 documentos)

Tema 7 - Familia y padres e hijos (356 documentos)

Tema 8 - Episodios de atracones y purgas (328 documentos)

Tema 9 - Género y subgrupos (282 documentos)

Tema 10 - Trastorno alimentario no especificado (EDNOS; 275 documentos)




Un hallazgo interesante que se puede observar en la Figura es el hecho de que los estudios con muestras clínicas fueron más evidentes durante los años 80 y mediados de los 90, mientras que los estudios centrados en los factores de riesgo han crecido exponencialmente a partir de finales de los 90. Algo parecido ocurrió con los estudios sobre los efectos de tratamientos. En esencia, los resultados sugieren que hubo un giro histórico (hacia finales de los 90) en la literatura sobre trastornos alimentarios, enfatizándose la prevención y la mejora en los resultados de tratamientos (intervenciones basadas en la evidencia).


Para más información, puedes leer el artículo y echar un vistazo al código Python en mi GitHub.


40 visualizaciones0 comentarios

Comments


bottom of page