La detección de depresión con inteligencia artificial (IA) se ha convertido en una línea de investigación cada vez más relevante dentro de la salud mental digital. En esta nota nos basaremos en un metaanálisis, que examinó si los modelos asistidos por IA, especialmente aquellos que combinan múltiples fuentes de información fisiológica y conductual, podrían mejorar el screening clínico de la depresión. La pregunta de fondo es: ¿un algoritmo es capaz de advertir indicios que podrían quedar fuera del radar con otros métodos?
De la entrevista clínica al dato digital

La depresión es uno de los cuadros psicopatológicos más frecuentes y discapacitantes a nivel mundial. Su detección temprana continúa siendo un desafío debido a que, en la práctica, el diagnóstico suele apoyarse en entrevistas, historia del paciente y cuestionarios autoinformados. Tales herramientas, aunque indispensables, yacen atravesadas por sesgos de respuesta, dificultades para expresar los síntomas, variabilidad clínica y limitaciones para llevar a cabo evaluaciones a gran escala.
En los últimos años, distintas tecnologías no invasivas comenzaron a emplearse para identificar señales asociadas a la depresión. Entre ellas se encuentran la electroencefalografía, el seguimiento de movimientos oculares, el análisis de voz, el video, las expresiones faciales y la marcha. Cada modalidad aporta datos objetivos sobre procesos emocionales, cognitivos, motores o conductuales. No obstante, es un fenómeno heterogéneo, por lo que necesita múltiples fuentes para capturar su complejidad.
Cuando un estímulo no alcanza
Los modelos de inteligencia artificial multimodal buscan integrar distinta información en una misma evaluación. La premisa es sencilla pero potente: si la depresión se expresa en la voz, la actividad cerebral, la expresión facial o el movimiento corporal, la combinación mediante IA podría ofrecer un screening más preciso. Con dicha hipótesis como punto de partida, el metaanálisis revisó la evidencia disponible sobre el rendimiento de tales herramientas.
¿Cómo se auditó la evidencia?
Los autores realizaron una revisión sistemática y metaanálisis siguiendo los criterios PRISMA. Se seleccionaron análisis en inglés que utilizaran algoritmos de machine learning o deep learning para clasificarla a partir de estímulos fisiológicos o conductuales. Es decir, investigaciones en las que la IA analizaba variables del cuerpo o del comportamiento para identificar patrones asociados a la depresión.
En total, se incluyeron 80 estudios en la síntesis cualitativa y en el metaanálisis. Estos trabajos evaluaron distintas modalidades: electroencefalografía, movimientos oculares, video, audio, marcha y combinaciones multimodales. Asimismo, extrajeron indicadores como sensibilidad, especificidad y AUC, una medida que estima qué tan bien un modelo distingue entre personas con y sin depresión para estimar el rendimiento.
La ventaja de mirar el cuadro completo
Los métodos multimodales asistidos por IA fueron los que mostraron mejor rendimiento. A grandes rasgos, combinaban varias fuentes de información y lograron distinguir con mayor precisión entre personas con y sin depresión.

Lo anterior sugiere que considerar señales como voz, actividad cerebral, expresión facial, movimiento o lenguaje ofrece una lectura más completa del cuadro psicológico. En lugar de depender de un único indicador, se construye una mirada más amplia del estado emocional y conductual de la persona.
Una pista útil, pero no todo el mapa
Los enfoques basados en una sola modalidad también resultaron útiles, aunque fueron menos consistentes. Algunas señales, como la electroencefalografía y el audio, mostraron un desempeño particularmente prometedor para apoyar la detección de depresión.
Sin embargo, la evidencia apunta a que la verdadera ventaja aparece cuando distintas modalidades se abordan en un mismo modelo. En términos prácticos: una señal ayuda a orientar; varias bien articuladas mejoran la toma de decisiones clínicas.
El rol del deep learning en la integración de datos
Los modelos de deep learning parecieron ser adecuados para trabajar con información compleja y heterogénea. Es decir, el screening multimodal, más que solo sumar datos, consiste en identificar patrones entre estímulos muy diversos entre sí.
La voz, la expresión facial, la actividad cerebral o el movimiento corporal no hablan el mismo idioma técnico. Por eso, los modelos más avanzados podrían aportar valor al encontrar relaciones que serían difíciles de detectar tradicionalmente.
De la precisión estadística a la utilidad clínica
El hallazgo más importante no es que la IA detecte depresión por sí sola, sino que fortalece el proceso de screening. Clínicamente, dichas herramientas ayudan a la detección precoz, complementando lo obtenido en entrevistas y cuestionarios.
Aun así, su utilidad dependerá de cómo se integren en la práctica profesional. Para que aporten valor real, deben funcionar como herramientas de apoyo, con supervisión y criterios claros de interpretación. La IA podría aportar indicadores más objetivos, aunque no elimina la complejidad del diagnóstico.
Limitaciones
Primeramente, solo se incluyeron artículos en inglés, posiblemente dejando fuera evidencia relevante publicada en otros idiomas. Además, muchos estudios tuvieron tamaños muestrales pequeños y se requiere mayor cantidad para generalizar adecuadamente. También se observó heterogeneidad entre estudios, diferencias en la recolección de datos y falta de estandarización en el preprocesamiento de algunas modalidades.

Otro aspecto crítico es la aplicabilidad clínica y ética. Las señales utilizadas —voz, video, expresiones faciales, EEG o patrones de marcha— son datos sensibles. Por eso, cualquier implementación debe contemplar consentimiento informado, protección robusta de la privacidad, transparencia algorítmica y supervisión profesional. A esto se suma que aún faltan estudios que analicen el rendimiento en poblaciones diversas.
Entre la terapia y el dashboard
La evidencia disponible sugiere que la IA multimodal podría mejorar el screening de depresión, sobre todo cuando combina información fisiológica y conductual mediante modelos avanzados. Su valor principal yace en complementar la evaluación clínica, detectar señales tempranas y ampliar la capacidad de tamizaje en contextos donde los recursos son limitados.
Todavía queda una brecha importante entre el rendimiento estadístico y la implementación segura. Para avanzar, se necesitan bases de datos más amplias, diversas y estandarizadas; validación externa; modelos interpretables; mejores diseños de investigación y marcos regulatorios claros. La inteligencia artificial se convierte en una posible aliada estratégica, pero siempre supervisada por el criterio humano.
Referencia bibliográfica
- Wang, L., Wang, C., Li, C., Murai, T., Bai, Y., Song, Z., Zhang, S., Zhang, Q., Huang, Y., Bi, X. y Jiang, J. (2025). AI-assisted multi-modal information for the screening of depression: a systematic review and meta-analysis. NPJ Digital Medicine, 8(1), 523.





















