El habla

Abordar el estudio del lenguaje oral desde el punto de vista material, de su realización física o acústica, es referirse al habla; por lo que en este capítulo emplearemos los términos lenguaje o habla humana de forma indistinta. Lo primero que no hay que olvidar es que el habla es sonido.
El sonido se produce cuando un cuerpo vibra y comunica la vibración a las moléculas del entorno (aire, agua) y esta energía es recibida por el oído. En el vacío no puede oírse el sonido porque faltan las moléculas que transportan la energía vibratoria.

Las piezas básicas del sonido son las ondas puras o simples, que no pueden descomponerse en ninguna otra. Una onda comprende una sucesión de ciclos o patrones de vibración que se repiten en el tiempo, y cada ciclo está formado por un pico que sube y un valle que baja en torno a un punto central de energía cero.

Onda pura o simple. Se han marcado un ciclo y la amplitud entre un pico y un valle. La línea central corresponde a energía cero.

Las ondas que nacen de movimientos vibratorios rápidos, tienen una frecuencia alta, con muchos ciclos por segundo (o hercios) y se perciben como agudas. Las ondas que nacen de movimientos vibratorios lentos, tienen una frecuencia baja, con pocos ciclos por segundo y se perciben como graves. En los seres humanos, las voces masculinas son más graves porque las cuerdas vocales de los varones son más largas que las de las mujeres. Otra dimensión importante es la intensidad o amplitud del desplazamiento de la onda, entre el pico y el valle. Desde el punto de vista perceptivo, su unidad es el decibelio (dB), que es una medida relativa y no lineal que abarca desde 0 dB, o umbral de la audición, hasta más de 140 dB, que es el umbral del dolor al sonido. Una conversación normal se sitúa entre 40 y 60 dB.

La suma de varias ondas simples da lugar a una onda compleja. En realidad, lo que existe en la naturaleza son ondas complejas, pues las simples sólo se consiguen por medios electrónicos o con dispositivos especiales como el diapasón para afinar instrumentos musicales.

Hay dos clases de ondas complejas:

  • Periódicas. Tienen ciclos o patrones complejos de vibración que se repiten de forma periódica.
    • Perceptivamente oímos un sonido dotado de un tono o tonalidad; es el caso de las notas musicales, de un silbido, de una sirena o de las vocales y consonantes sonoras.
    • En el lenguaje corresponden a los sonidos sonoros producidos por la vibración de las cuerdas vocales (vocales, y consonantes sonoras como /b/, /d/, /g/, /m/, /n/, /r/, /l/, etc.).
  • Aperiódicas. No se pueden apreciar ciclos repetitivos.
    • Perceptivamente se perciben como ruidos, sin tono, como ocurre con los sonidos causados por un soplo, un golpe, una fricción, una explosión o las consonantes sordas.
    • En el lenguaje corresponden a los ruidos o sonidos sordos producidos por el paso del aire a través de un sitio estrecho, o una pequeña explosión generada por la brusca liberación de una obstrucción (/s/, /f/, /Ɵ/, /p/, /t/, /k/, etc.).
A) Onda acústica de la frase «Los médicos salen a la calle». B) Fragmento ampliado de la onda aperiódica correspondiente a la consonante /s/ de «médicos»; en ella no se aprecian ciclos periódicos y se percibe como un ruido. C) Fragmento de onda periódica de la vocal /e/ de «salen»; en ella se aprecian claramente los ciclos periódicos.

Espectrogramas

Una onda acústica contiene mucha información que no es posible observar directamente mediante la mera inspección de su forma. Sabemos que una onda compleja se compone de muchas otras simples, cada una con una frecuencia y una intensidad particulares, por lo que el sonido posee distintos grados de energía en unas frecuencias u otras. ¿No hay alguna forma de visualizar la distribución de esta energía a través de las frecuencias? Esto se consigue gracias a los espectrogramas obtenidos mediante un espectrógrafo.

Dos ejemplos de espectrogramas. A) Espectrograma creado por un espectrógrafo. El principio básico es el mismo que el de un prisma que descompone la luz en sus colores integrantes. El sonido pasa a través de un banco de filtros, cada uno especializado en una frecuencia determinada. Cuando los filtros se activan, queman el papel encerado y lo tiznan de negro mientras que va girando por un rodillo en la dirección que indica la flecha. Las partes oscuras corresponden a las zonas de mayor energía. B) Onda (arriba) y espectrograma (abajo) de la frase «¿Quieres más café?» pronunciada por una mujer. Obsérvense los formantes (F1, F2, F3, F4, F5), las estrías correspondientes a los movimientos de apertura y cierre de las cuerdas vocales y la oclusión de la consonante c (/k/) de «café». En las consonantes sordas (/s/,/f/) no se aprecian estrías.

Así es como se obtuvieron los primeros espectrogramas, en los que aparecían representadas las tres dimensiones básicas del sonido: el tiempo, en el eje horizontal, las diferentes frecuencias en el eje vertical, y la amplitud en la mayor o menor intensidad del dibujo.

El espectrógrafo de sonido se reveló especialmente útil para el análisis del habla humana, y la espectrografía acústica ha sido la técnica reina en su estudio. Hoy los espectrogramas se obtienen en los ordenadores a través de software especializado, alguno libre en Internet como el célebre Praat (Praat: doing Phonetics by Computer (uva.nl)).

Para hacernos una idea de la importancia que tienen los formantes en la percepción del lenguaje, hay que señalar que podemos entender frases completas basándonos únicamente en dos o tres ondas puras, si éstas siguen la trayectorias de los formantes, como demostraron Robert Remez y cols.,(1981). En la figura A se muestra el espectrograma de la frase «El avión vuela sobre las nubes altas», y en la figura B, el de un estímulo acústico formado por dos ondas simples que siguen las trayectorias del primero y del segundo formantes (F1 y F2). Con un mínimo entrenamiento, cualquier persona puede entender la frase completa escuchando el estímulo artificial.

Importancia de los formantes en la percepción del lenguaje. A) Espectrograma de la frase «El avión vuela sobre las nubes altas» dicha por un varón. B) Réplica acústica formada únicamente por dos ondas puras que siguen las trayectorias del primero (F1) y del segundo (F2) formante de la frase. Escuchando este estímulo artificial se puede percibir la frase completa. Ejemplo tomado de González y Cervera (2000).

Síntesis del habla

Mediante el espectrógrafo se pasa de la onda al espectrograma; se analiza el sonido en sus partes. ¿No sería posible el camino inverso? Es decir, a partir de un espectrograma reconstruir artificialmente la onda completa para ser escuchada. En este caso estaríamos hablando de síntesis, o pasar de las partes al todo; justamente lo contrario del análisis, que es pasar del todo a las partes.

Con el desarrollo de la electrónica han surgido sistemas de síntesis de voz mucho más perfectos que el reproductor de patrones de los laboratorios Haskins. En los años ochenta hizo su aparición un sintetizador desarrollado por Dennis Klatt en el Instituto Tecnológico de Massachusetts que generaba una voz artificial muy parecida a la natural, basándose en un modelo matemático del tracto vocal humano. Constituye el núcleo de uno de los conversores texto-voz más conocidos, el DECtalk, un sistema de habla artificial particularmente útil para las personas imposibilitadas de hablar, como es el caso del físico y matemático de Cambridge, Stephen Hawking, afectado de esclerosis lateral amiotrófica.

Referencias

  • Cuetos Vega, González Álvarez, Vega, and Vega, Manuel De. Psicología Del Lenguaje. 2ª Edición. ed. Madrid: Editorial Médica Panamericana, 2020.
  • YouTube

Deja un comentario

20 − 5 =

Ir al contenido