La comunicación es un aspecto esencial en la vida de los seres humanos. Tal es así que, en situaciones donde el ambiente es ruidoso, aún podemos enfocarnos en lo que nos dice otra persona. Esta habilidad fue descrita por Colin Cherry como efecto de fiesta cóctel, y refiere a la capacidad de dirigir la atención a ciertos estímulos. Respecto al nombre, hace alusión a cuando queremos conversar en una fiesta, pero se torna un desafío por la multiplicidad de ruidos. En esta nota explicaremos qué es este efecto, cómo se vincula con la atención y qué estudian las investigaciones actuales sobre este fenómeno.
¿Qué es el efecto de fiesta cóctel?
El efecto de fiesta cóctel (cocktail party effect, en inglés) es la habilidad del sistema auditivo humano para enfocarse en una única conversación mientras ignora el ruido de fondo. El fenómeno fue investigado por el científico cognitivo Colin Cherry, en 1953, durante experimentos en el Instituto de Tecnología de Massachusetts. Allí, Cherry abordó este efecto y propuso varios factores que podrían facilitar la creación de un filtro capaz de separar voces en un ambiente ruidoso:
- Procedencia de las voces desde diferentes direcciones: La ubicación de las fuentes de sonido puede ayudar a distinguirlas.
- Pistas visuales, como el lenguaje corporal y gestos: Las señales visuales también complementan la percepción auditiva.
- Diferencias en características vocales como el tono y la velocidad: Las variaciones en las características de la voz pueden facilitar la separación de las voces.
- Variaciones en acentos: Es posible que diferentes acentos ayuden a identificar a los hablantes.
- Probabilidades de transición basadas en el contenido y sintaxis: La estructura y el contenido de la conversación pueden influir en la capacidad de separar las voces.
Las investigaciones de Cherry en el efecto de fiesta cóctel
Por otro lado, la mayoría de tales factores podían eliminarse grabando dos mensajes del mismo hablante en una cinta. Aparentemente, esto resultaba en un desafío abrumador: un caos de sonidos entremezclados. Sin embargo, Colin Cherry sugirió que los seres humanos poseen una memoria excepcional para las probabilidades de transición, lo que les permite prever secuencias de palabras con relativa facilidad (Arons y Cambridge, 1992).
Con este contexto, el científico desarrolló el paradigma de la escucha dicótica y la técnica de sombreado y, naturalmente, dichos aportes se volvieron fundamentales en la psicología cognitiva. Pues, permitían entender cómo funcionaba la atención selectiva en situaciones con múltiples fuentes de información.
Paradigma de escucha dicótica y técnica de sombreado
En primer lugar, el paradigma de la escucha dicótica consiste en presentar información diferente en ambos oídos, pidiendo al participante que se enfoque en un mensaje específico. Mientras que, la técnica de sombreado requiere que se repita en voz alta el mensaje seleccionado, fortaleciendo la atención a ese estímulo. Estos estudios demostraron que la atención selectiva es más efectiva cuando los mensajes difieren en aspectos físicos, como voces o volúmenes. Así, el informar al sujeto previamente a qué canal debe atender, mejora su rendimiento.
Como consecuencia, cuando se repite el mensaje focalizado, se registra muy poco del mensaje irrelevante. Pero si se recuerda algo, suele ser información física, no semántica. Gracias a esta clase de experimento, se asentaron las bases para comprender cómo operamos la atención en entornos donde se presenta el efecto de fiesta cóctel y cómo se priorizan ciertos aspectos en la percepción auditiva.
Efecto de fiesta cóctel: Aportes al estudio de la atención
Hasta la fecha, se han planteado distintos modelos atencionales en psicología cognitiva para comprender cómo seleccionamos y procesamos información en entornos complejos. Veamos algunos (Carboni y Barg, 2016).
El modelo de Broadbent (1958)
En un intento por explicar los fenómenos observados por Colin Cherry en el efecto de fiesta cóctel, Broadbent propuso un Modelo de filtro temprano que operaba en las primeras etapas del procesamiento perceptivo. Allí, el autor decidió enfocarse en las características físicas de los estímulos. Sin embargo, investigaciones posteriores demostraron que la selección de estímulos también depende de factores semánticos.
El modelo de Treisman y Geffen (1967)
Treisman y Geffen revisaron el modelo de Broadbent y propusieron el Modelo de filtro atenuado, que postula un procesamiento en dos fases: extracción de rasgos antes del filtro y clasificación semántica después del filtro. Este modelo sugiere que la atención actúa como un atenuador que delimita el análisis de información, considerando aspectos tanto físicos como semánticos.
El modelo de Deutsch y Deutsch (1963)
Deutsch y Deutsch introdujeron el concepto de filtro tardío o poscategorial, donde la selección se realiza después del análisis y justo antes de la respuesta. Según el modelo, solo los estímulos seleccionados por el filtro son percibidos por el sujeto, dependiendo de la pertinencia de estos en función de la situación y el estado del organismo.
El efecto de fiesta cóctel en investigaciones actuales
Procesamiento del habla audiovisual
El procesamiento audiovisual del habla implica que el cerebro procesa la información de dos fuentes simultáneamente: los sonidos del habla y las señales visuales, como las expresiones faciales. Por lo que, en situaciones de conversación, no solo atendemos a lo que escuchamos, sino que también tenemos en cuenta cómo se pronuncian las palabras mediante pistas visuales.
Por ejemplo, Wikman et al. (2021) investigaron cómo el cerebro maneja el procesamiento audiovisual del habla en entornos ruidosos. De esta manera, indicaron que, durante la concentración en la escucha del habla en un entorno caótico, ocurría una modulación específica y predecible en las respuestas neuronales en varias regiones cerebrales.
En la misma línea, descubrieron la influencia semántica en la selección de los sonidos del habla. Incluso, en áreas cerebrales relacionadas con el procesamiento inicial del habla, como el giro de Heschl. Esto sugiere que el cerebro no solo procesa los sonidos del habla de manera pasiva, sino que también considera el significado en función del contexto y el contenido semántico. Sin embargo, aún quedan interrogantes sobre los mecanismos neurales precisos que subyacen al proceso.
Inteligencia artificial en dispositivos de audición
Por su parte, Fischer et al. (2021), se enfocaron en mejorar la calidad del sonido en situaciones ruidosas, como en una fiesta donde hay muchas conversaciones. Para hacerlo, combinaron señales de micrófonos reales y virtuales y las utilizaron en un dispositivo llamado beamformer (conformador de haces, en español). A modo de aclaración, este dispositivo es un sistema de procesamiento de señales que se utiliza en audífonos o implantes cocleares.
Lo que descubrieron es que, para obtener la mejor calidad de sonido, los micrófonos reales debían estar lo más cerca posible de la fuente de sonido que se deseaba escuchar. Pero, en la práctica, esto resultaba incómodo. Así, para resolver el problema, utilizaron señales de micrófonos virtuales creadas por una inteligencia artificial.
Como resultado, obtuvieron evidencias de que las personas que usan audífonos o implantes cocleares podrían beneficiarse de estas señales de micrófono virtuales. Especialmente, en situaciones donde se da el efecto de fiesta cóctel.
Conclusión
El efecto de fiesta cóctel de Colin Cherry demuestra cómo aquellas experiencias que naturalizamos, son en realidad, algo muy interesante de investigar. En ese sentido, la psicología cognitiva, específicamente en sus estudios de atención, se ha beneficiado de los aportes relacionados al efecto. E incluso, aún continúa enriqueciéndose de nuevos descubrimientos en campos como el de la inteligencia artificial.
Referencias bibliográficas
- Arons, B. y Cambridge, M. (1992). A Review of The Cocktail Party Effect. Crown Business Publishing.
- Carboni, A. y Barg, G. (2016). Atención. En A. Vásquez Echeverría (Ed.) Manual de Introducción a la Psicología Cognitiva (pp. 89-116). UdelaR.
- Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with two ears. The Journal of the Acoustical Society of America, 25(5), 975-979. https://doi.org/10.1121/1.1907229
- Fischer, T., Caversaccio, M. y Wimmer, W. (2021). Speech signal enhancement in cocktail party scenarios by deep learning based virtual sensing of head-mounted microphones. Hearing Research, 408(108294), 108294. https://doi.org/10.1016/j.heares.2021.108294
- Wikman, P., Sahari, E., Salmela, V., Leminen, A., Leminen, M., Laine, M. y Alho, K. (2021). Breaking down the cocktail party: Attentional modulation of cerebral audiovisual speech processing. NeuroImage, 224(117365), 117365. https://doi.org/10.1016/j.neuroimage.2020.117365