Percepción de las consonantes

Las consonantes son producidas por movimientos o gestos articulatorios rápidos que se imponen sobre los más lentos de las vocales. No es posible pronunciar algunas consonantes de forma aislada, sin la ayuda de una vocal: /p/, /t/, /k/, /b/, /d/, /g/. Algunos autores consideran que las sílabas son, en esencia, vocales alteradas por delante o detrás por consonantes; es como si las consonantes fueran los «márgenes» de las vocales. La percepción de las consonantes es esencial para entender el lenguaje y obedece a procesos más complejos que las vocales.

Transiciones formánticas

Existen múltiples pistas perceptivas en la señal del habla para la identificación de los sonidos consonanticos, por ejemplo, la composición del ruido en las fricativas como la /s/ o la /f/, los formantes propios de algunas consonantes como /m/, /n/, /l/, etc. Por encima de todas las pistas, destaca una por ser la más importante: las transiciones de los formantes vocálicos. Cuando pronunciamos una vocal de modo aislado (p. ej., /a/), sus formantes presentan una apariencia estable, más o menos plana en dirección horizontal. Si la pronunciamos precedida o seguida de una consonante (p. ej., /pa/), la trayectoria formántica se ve alterada hacia arriba o hacia abajo, por influencia de esa consonante. Esto ocurre en la transición consonante-vocal, si es una sílaba directa, o vocal-consonante, si es una sílaba inversa. Estas rápidas inclinaciones formánticas causadas por la presencia de una consonante se conocen como transiciones de los formantes y constituyen una pista clave para su identificación. Esto es especialmente evidente en las consonantes oclusivas.

fig5 15 Percepción de las consonantes
Espectrograma de /apa/. Transiciones de los formantes vocálicos por influencia de las consonantes. Compárese el espectrograma del /a/ con el de /pa/. En este último, la porción inicial de los formantes es «empujada» hacia abajo por la influencia de /p/ (flecha).
fig5 16 Percepción de las consonantes
Las transiciones formánticas son clave para percibir las consonantes.

Las transiciones de F1 y F2 son cruciales para percibir las consonantes, sobre todo las de F2. Nuestro sistema perceptivo se vale de ellas para identificar con gran rapidez los distintos sonidos consonanticos que van apareciendo en el habla fluida. En unos casos las transiciones son hacia arriba, más o menos pronunciadas, y en otros, son hacia abajo, dependiendo de cada consonante y, muy importante, también de la vocal. No hay una relación simple del tipo: todas las /d/ darán lugar a una transición hacia arriba, todas las /k/ causarán transiciones hacia abajo. La relación es mucho más compleja, pero nuestro sistema perceptivo se encuentra cómodo en esa complejidad porque no se equivoca.

fig5 17 Percepción de las consonantes
Versiones estilizadas de los dos primeros formantes. Ejemplo de ausencia de invarianza acústica. En las dos silabas (/di/, /du/), el primer sonido suena /d/ a pesar de que las transiciones formánticas son distintas.


El gran problema teórico sobre la percepción del habla es la ausencia de invarianza acústica. Es decir, la ausencia de algo constante en la representación espectrográfica que corresponda a una consonante particular. Es un problema que causó perplejidad en los estudios pioneros y ha traído de cabeza a los investigadores durante varias décadas, porque no hay que olvidar que ese «algo constante» sí lo encuentra nuestro sistema perceptivo (si no, no oiríamos la misma consonante). De la diversidad de explicaciones propuestas se han derivado diferentes teorías sobre la percepción del lenguaje.

Percepción categórica

Las vocales se perciben de modo continuo: cambios graduales y continuos de las frecuencias de los formantes se perciben de forma continua. Por el contrario, las consonantes, especialmente las oclusivas (/p/, /t/, /k/, /b/, /d/, /g/), se perciben de forma categórica. Los cambios continuos y graduales de los sonidos consonánticos no son percibidos de modo continuo, sino de forma discreta o por categorías.

El estudio seminal de Liberman, Harris, Harris et al. (1957) fue el primero que lo puso de manifiesto. Sintetizaron una serie de 14 estímulos formados por representaciones esquemáticas de F1 y F2 para ser escuchados por el Pattern Playback.

fig5 18 Percepción de las consonantes
Percepción categórica de las consonantes. Los estímulos 1 a 4 se oyen como /be/; los estímulos de 5 a 9 se oyen como /de/, y los estímulos de 10 a 14 se oyen como /ge/. Dentro de cada grupo no se perciben diferencias. Tomado de Liberman, Harris et al. (1957).

Los experimentos que estudian la percepción categórica utilizan dos tipos de tareas, cuyos resultados se comparan entre ellas: tareas de discriminación y tareas de identificación:

  • En las tareas de discriminación los estímulos se comparan entre sí. Hay varios paradigmas experimentales posibles.
    • Paradigma AX. Se presenta un estímulo y a continuación otro, que puede ser el mismo estímulo repetido u otro distinto; la tarea del oyente consiste en responder «igual» o «diferente».
    • Paradigma ABX. Se presentan dos estímulos sucesivos que siempre son distintos (y así se indica en las instrucciones); a continuación se presenta un tercer estímulo que siempre es uno de los dos anteriores: el oyente debe decidir cuál de los dos es este tercer estímulo. Las tareas pueden resultar más fácil o difícil manipulando ciertas variables, entre ellas el tiempo que media entre los estímulos.
  • En la tarea de identificación se presenta un único estímulo en cada ensayo y el oyente debe identificarlo indicando la etiqueta o nombre del estímulo; en este caso, de qué consonante se trata.

En ambos tipos de prueba los estímulos se presentan en ensayos aleatorios, para evitar cualquier efecto de orden. La discriminación guarda relación con la identificación: hay una discontinuidad en los resultados: error dentro de la misma categoría, y desempeño casi perfecto entre categorías distintas.

¿Por qué los sonidos del habla, en concreto las consonantes oclusivas, se perciben de forma discontinua o categórica, al contrario que otros muchos sonidos, que son percibidos de modo continuo (p. ej., tonos)? Los autores defensores de un mecanismo especial para la percepción del lenguaje han visto en ello una constatación de su existencia. Lo cierto es que la percepción categórica se ha hecho evidente no sólo respecto a las transiciones de F2, sino también en relación con otras dimensiones acústicas relevantes para la distinción entre consonantes, por ejemplo el contraste sordo-sonoro.

Contraste sordo-sonoro

tabla5 01 Percepción de las consonantes

El parámetro «estrella» en la investigación psicolingüística sobre percepción del lenguaje es, sin duda, el conocido como voice onset time o VOT. De su valor depende que percibamos una oclusiva sorda o una sonora. Para entender cómo afecta el VOT a la percepción, hay que revisar antes la mecánica articulatoria de las consonantes oclusivas. Cuando pronunciamos una de ellas, por ejemplo en posición inicial de sílaba, hay una secuencia de los siguientes movimientos articulatorios:

  • Movimiento 1: oclusión o interrupción completa, durante varias decenas de mili-segundos, de la salida de aire de la boca y, por lo tanto, de la energía acústica. La oclusión se realiza con los labios en las consonantes labiales /b/ y /p/, con la lengua contra los dientes en las dentales castellanas /t/ y /d/ o con la parte posterior de la lengua contra el velo del paladar en las velares /g/ y /k/.
  • Movimiento 2: liberación del aire. Los órganos fonadores se separan bruscamente liberando el aire a presión y dando lugar a una pequeña explosión.
  • Movimiento 3: comienzo de vibración de las cuerdas vocales para el inicio de la vocal que sigue a la oclusiva.

Existe una sincronización temporal muy fina, de milisegundos, entre estos tres movimientos a pesar de que pertenecen a grupos musculares y nervios craneales distintos. Esta perfecta coordinación, cuyo mecanismo responsable probablemente se ubica en el área de Broca de la corteza cerebral, puede verse alterada en ciertos trastornos del habla.

El VOT es la distancia temporal entre los movimientos 2 y 3. Es decir, los milisegundos que transcurren desde la liberación brusca del aire hasta el inicio de la vibración de las cuerdas vocales. En inglés la frontera de las labiales se sitúa en torno a 25-30 ms: la consonante sorda (/p/) tiene un VOT superior a ese límite, y la sonora (/b/) inferior. En castellano, el límite se sitúa en torno a un VOT de 0 ms.

tabla5 02 Percepción de las consonantes

Uno de los trabajos más citados sobre la percepción del VOT es el estudio pionero de Abramson y Lisker (1967), los resultados mostraron que la percepción era claramente categórica.

fig5 19 Percepción de las consonantes
Respuesta en una tarea de identificación (consonante B frente a P) de estímulos artificiales de habla, cuyo VOT varía entre -150 a +150 ms, en incrementos de 10. Las respuestas presentan una distribución claramente categórica, con una estrecha zona de incertidumbre en torno al límite de VOT de +25 -30 ms. Datos basados en Abramson y Lisker (1967).

Trabajos más recientes indican que los oyentes sí pueden percibir diferencias entre los estímulos de una misma categoría fonética y que ésta cuenta en su interior con una rica estructura interna organizada en torno a representaciones prototípicas (Miller, 1994). Parece que la percepción categórica confiere al oyente la ventaja de centrarse en los aspectos de la señal que son importantes para identificar los fonemas e ignorar variaciones no esenciales dentro de la categoría fonética, lo que descargaría de trabajo al sistema perceptivo y permitiría concentrar casi todos los recursos cognitivos en lo que verdaderamente importa en el lenguaje: la extracción del significado.

Referencias

  • Cuetos Vega, González Álvarez, Vega, and Vega, Manuel De. Psicología Del Lenguaje. 2ª Edición. ed. Madrid: Editorial Médica Panamericana, 2020.

Deja un comentario

1 × cuatro =

Ir al contenido