En la sección anterior, hemos visto que la función de los sonidos del habla es conformar las expresiones de los signos de una lengua y que estos deben ser suficientemente distintos, es decir, distinguibles por sus usuarios, para poder codificar información. Para conseguir este fin, los sonidos individuales de una lengua —también llamados, "segmentos" o "fonos"— cumplen una función distintiva o contrastiva, de modo que dos signos puedan distinguirse solo por la sustitución de un sonido por otro. Esto se observa nítidamente en la existencia de pares mínimos: por ejemplo, las palabras maleta y paleta del castellano son distintas y la única diferencia de su expresión son los sonidos iniciales [m] y [p]; lo mismo ocurre con las palabras fácil y fósil, que se diferencian por las vocales [a] y [o]; con las palabras cardo y cargo que se diferencian por las consonantes aproximantes [ð̞] y [ɣ̞]; y así con muchos otros términos.
Sin embargo, algunos fonos del castellano no se pueden utilizar con una función distintiva uno con respecto al otro. Es el caso, por ejemplo, de los segmentos [b] y [β̞], que vimos en la sección anterior. Efectivamente, estos dos sonidos no contrastan entre sí en castellano porque no pueden aparecer en el mismo contexto fónico y, por lo tanto, no pueden producir un par mínimo en esta lengua. No encontramos en castellano, al lado de la palabra bata [ˈbata], una hipotética palabra [ˈβ̞ata] que sea distinta de aquella. De hecho, como vimos, la palabra bata se pronuncia [ˈbata] en la frase en bata [emˈbata] y se pronuncia [ˈβ̞ata] en la frase la bata [laˈβ̞ata] en la mayoría de las variedades de castellano.
El hecho de que la misma palabra presente, alternativamente, dos sonidos diferentes en la misma posición muestra que estos dos sonidos cumplen la misma función en la construcción de la expresión de dicha palabra. En el ejemplo que hemos examinado, la palabra bata está conformada por cuatro unidades fónicas, pero la primera de ellas puede realizarse como [b] o como [β̞]. En la medida en que estos dos sonidos cumplen la misma función, podemos considerarlos manifestaciones o realizaciones de una unidad de construcción más abstracta. De hecho, ambos sonidos contrastan, de manera independiente, con otros sonidos de la lengua, como muestran los siguientes ejemplos.
Las palabras bata [ˈbata], data [ˈdata] y gata [ˈɡata] nos muestran que los sonidos oclusivos [b, d, ɡ] cumplen una función contrastiva o distintiva uno respecto del otro. Lo mismo nos muestran las frases la bata [laˈβ̞ata], la data [laˈð̞ata] y la gata [laˈɣ̞ata] con respecto a los sonidos aproximantes [β̞, ð̞, ɣ̞]. Lo que también muestra este corpus es que las parejas de fonos [b ~ β̞], [d ~ ð̞] y [ɡ ~ ɣ̞] funcionan como unidades que contrastan entre sí.
En resumen, los segmentos [b, β̞, d, ð̞, ɡ, ɣ̞] forman parte del inventario de sonidos del castellano. Los sonidos [b, d, ɡ] presentan un uso o función contrastiva uno con respecto al otro porque, al aparecer en el mismo contexto fónico, pueden formar pares (o tríos) mínimos de palabras. Esto mismo ocurre con los sonidos [β̞, ð̞, ɣ̞]: al aparecer en el mismo contexto fónico, pueden producir expresiones diferentes, como la bata [laˈβ̞ata], la data [laˈð̞ata] y la gata [laˈɣ̞ata] (o como haba [ˈaβ̞a], hada [ˈað̞a], haga [ˈaɣ̞a]). Por otra parte, los segmentos que conforman las parejas [b ~ β̞], [d ~ ð̞] y [ɡ ~ ɣ̞] presentan un uso o función no contrastiva uno con respecto al otro, pues, al no poder aparecer en el mismo contexto fónico, no pueden formar pares mínimos de palabras. Sin embargo, cada pareja de segmentos sí funciona de manera contrastiva o distintiva con respecto a las otras parejas.
El uso no contrastivo de sonidos también se puede observar, por ejemplo, en el hecho de que no puedan existir en castellano dos palabras distintas tales que una se pronuncie [aˈβ̞al] y la otra, [aˈbal]; de hecho, solo existe la palabra aval, que, en la mayoría de los dialectos de castellano se pronuncia [aˈβ̞al]. Esto muestra que, en nuestra lengua, la relación entre los sonidos [b] y [β̞] es no contrastiva. Y lo mismo muestra la imposibilidad de dos palabras diferentes [peˈð̞al] y [peˈdal] o [saˈɣ̞al] y [saˈɡal], pues las palabras pedal y zagal solo se pronuncian con los sonidos [ð̞] y [ɣ̞], respectivamente, al menos, en la mayoría de los dialectos del castellano. (En el castellano amazónico del Perú, es común la pronunciación de estas palabras con las consonantes oclusivas: aval [aˈbal], pedal [peˈdal] y zagal [saˈgal]).
Tampoco pueden existir en castellano dos palabras distintas [ˈtʃ͡amba] y [ˈtʃ͡amβ̞a]; el hecho de que la palabra chamba solo se pronuncie con la consonante oclusiva muestra que los sonidos [b] y [β̞] no se utilizan de manera contrastiva el uno respecto del otro. Esto mismo se observa con respecto a las palabras panda y manga, que solo se pronuncian [ˈpan̪da] y [ˈmaŋga], respectivamente, y no [ˈpan̪ð̞a] y [ˈmaŋɣ̞a].
Como podemos observar, los sonidos oclusivos [b, d, ɡ] y los sonidos aproximantes [β̞, ð̞, ɣ̞] aparecen en contextos diferentes o complementarios: los primeros aparecen al inicio de la palabra, cuando la pronunciamos sola o luego de una consonante nasal, y al interior de la palabra luego de una consonante nasal; los segundos aparecen luego de una vocal tanto al inicio de la palabra como al interior de la palabra. El siguiente cuadro sintetiza la distribución complementaria de estos sonidos.
Resumiendo, los sonidos, segmentos o fonos funcionan, en general, como unidades para la construcción de las expresiones de los signos de una lengua. Algunos de ellos, que aparecen en los mismos contextos fónicos, contrastan entre sí, es decir, permiten diferenciar un signo de otro, como muestran los pares mínimos bata [ˈbata] y gata [ˈgata]. Otros sonidos, en cambio, no contrastan el uno respecto del otro, como los sonidos [b] y [β̞], porque nunca aparecen en el mismo contexto, sino en contextos complementarios. Las parejas de sonidos, como [b ~ β̞], sin embargo, sí contrastan con otras parejas de sonidos, como [d ~ ð̞] y [ɡ ~ ɣ̞]. Estas parejas funcionan como un "equipo" de unidades de construcción de enunciados cuyos miembros se distribuyen de manera complementaria: los sonidos oclusivos en unos contextos y los sonidos aproximantes en otros. Este tipo de distribución de los sonidos hace que su aparición sea predecible.
Las unidades de construcción de las expresiones de los signos de una lengua que contrastan entre sí se conocen como fonemas. Metodológicamente, los pares mínimos de palabras nos permiten una primera aproximación para identificar los fonemas de una lengua: la comparación de palabras como sal y cal o mula y mala nos da una pista de que los sonidos [s] y [k], así como [u] y [a], son fonemas de la lengua. Sin embargo, dado que hay parejas de sonidos que funcionan como una sola unidad de construcción —por ejemplo, [b ~ β̞], [d ~ ð̞] y [ɡ ~ ɣ̞]—, se debe tener presente que la noción de fonema (o unidad de construcción contrastiva) es abstracta y no se corresponde directamente con los sonidos o fonos. Más propiamente, como vimos líneas arriba, se debe afirmar que los fonemas se realizan como fonos o que los fonos corresponden a fonemas.
Como sabemos, la fonología utiliza la convención de representar gráficamente los fonos colocando los símbolos del Alfabeto Fonético Internacional (o algún otro alfabeto fonético) entre corchetes, como [s], [k], [u], [a], [b], [β̞], [d], [ð̞], [ɡ], [ɣ̞], etc. Para la representación gráfica de las unidades de construcción contrastivas, las unidades abstractas que llamamos "fonemas", la fonología propone colocar entre barras oblicuas el símbolo del Alfabeto Fonético Internacional del fono más usual con que se realiza el fonema o el de "mayor distribución" (Cerrón-Palomino 2018: 26). Así, por ejemplo, decimos que, en castellano, el fonema /s/ se realiza como [s] la mayoría de las veces aunque, en algunos casos, se realiza labializado [sʷ], como en las palabras su, azul, Jesús, etc., por aparecer adyacente al sonido [u]. De manera similar, decimos que el fonema /k/ se realiza no marcadamente como [k], pero que, cuando aparece antes de una vocal anterior, se pronuncia [k̟].
En el caso de parejas (o tríos o...) de sonidos que funcionan como una sola unidad de construcción abstracta, se dice que ambos fonos son realizaciones alternativas o alófonos de un mismo fonema. Así, se considera que [b ~ β̞] son realizaciones del fonema /b/; [d ~ ð̞] corresponden al fonema /d/ y [ɡ ~ ɣ̞] son alófonos del fonema /g/. La razón de elegir los símbolos /b, d, g/ en lugar de /β̞, ð̞, ɣ̞/ es que los primeros son los alófonos que se realizan más normalmente o son los no marcados; en palabras de Hualde (2014: 38), se debe usar el símbolo del “alófono principal o prototípico de cada fonema”. Debe tomarse en cuenta que no es correcto afirmar que los fonemas son /b, d, g/ y que sus alófonos son [β̞, ð̞, ɣ̞]. Los alófonos de los fonemas /b,/ /d/ y /g/ son [b ~ β̞], [d ~ ð̞] y [ɡ ~ ɣ̞], respectivamente.
Ahora bien, Cohn presenta un caso de alófonos en inglés que es similar al que hemos visto para el castellano. En inglés, las consonantes [p ~ pʰ], [t ~ tʰ] y [k ~ kʰ] forman parejas de sonidos que se distribuyen de manera complementaria y, por tanto, los contextos en los que aparece cada miembro de la pareja son predecibles. A continuación, aparece un pequeño corpus en el que se puede observar que las consonantes aspiradas aparecen solo al inicio de la palabra mientras que las no aspiradas aparecen luego de [s], así como al final de la palabra.
Estos datos muestran que los pares de consonantes aspiradas y no aspiradas funcionan como una sola unidad de construcción, lo que nos hace pensar que son alófonos o realizaciones de un mismo fonema. En este caso, diríamos que el inglés presenta los fonemas /p, t, k/ que se realizan, respectivamente, como [p ~ pʰ], [t ~ tʰ] y [k ~ kʰ].
Un fenómeno muy interesante que presenta Cohn es que dos lenguas diferentes pueden presentar, en su inventario, los mismos fonos o segmentos y puede ocurrir que estos se comporten de manera diferente en cada una de ellas. En efecto, dos fonos X e Y pueden usarse de manera contrastiva en una de las lenguas —es decir, pueden ser realizaciones de fonemas distintos— y de manera no contrastiva en la otra —es decir, pueden ser realizaciones del mismo fonema o alófonos—. La autora lo explica de la siguiente manera:
"Dos lenguas pueden presentar los mismos sonidos o fonos (...), pero su agrupamiento como fonemas o unidades contrastivas puede ser diferente. En inglés, por ejemplo, ocurren los sonidos [b, p, ph] (esto es, sonoros, sordos no aspirados y sordos aspirados); mientras que [ph] y [b] contrastan, el que aparezcan [p] o [ph] es predecible a partir del contexto, como se ilustra en [la siguiente figura]. Buy [baj] ‘comprar’ contrasta con pie [phaj] ‘tarta’, pero la realización de la oclusiva sorda como aspirada (pie [phaj] ‘tarta’) o no aspirada (spy [spaj] ‘espía’) es predecible y no existen pares mínimos para [p] y [ph]. (Se usa un asterisco para indicar que una forma no ocurre o es “agramatical”). Así, estas tres categorías fonéticas se mapean solamente a dos categorías fonológicas abstractas. En contraste, en tailandés, los tres sonidos ocurren y pueden producir contrastes de significado, como muestra el conjunto mínimo en [la siguiente figura]" (p. 186).
Cohn resume lo visto afirmando que "los tres fonos [b, p, ph] constituyen tres sonidos abstractos separados o fonemas en tailandés, pero solo dos en inglés". La distinción entre sonidos que pueden usarse contrastivamente y los que no es fundamental en las lenguas. El concepto de fonema, entendido como una unidad contrastiva abstracta, permite entender que sonidos diferentes puedan corresponder a una misma unidad en tanto alófonos de esa unidad. En distintos pasajes de su texto, Cohn caracteriza los alófonos como “realizaciones concretas o pronunciaciones” de un mismo fonema o como “parte del mismo fonema”; también afirma que se “agrupan” en fonemas o que se “mapean a (…) categorías fonológicas abstractas”. En nuestro curso veremos con más detalle estas diferentes maneras de entender los fonemas.
Para reforzar lo estudiado en esta sección, veamos otro ejemplo de alofonía, es decir, de sonidos o segmentos diferentes que, sin embargo, son realizaciones de una unidad más abstracta o corresponden a ella. Se trata del caso de las vocales orales y de las nasalizadas en castellano. Como muestra el corpus que aparece a continuación, cuando las vocales aparecen entre consonantes nasales (columna de la izquierda), se pronuncian nasalizadas; en otros contextos, se pronuncian orales.
Así pues, los miembros de cada par de vocales [ĩ ~ i], [ẽ ~ e], [ã ~ a], [õ ~ o], [ũ ~ u] se encuentran en distribución complementaria. Como nunca aparecen en el mismo contexto, las vocales orales y sus correspondientes nasalizadas no son contrastivas en castellano (aunque, en otras lenguas, como el francés, sí puedan serlo). En nuestra lengua, los pares [ĩ ~ i], [ẽ ~ e], [ã ~ a], [õ ~ o], [ũ ~ u] son variantes o alófonos de los fonemas /i, e, a, o, u/, es decir, son realizaciones alternativas de una misma unidad contrastiva abstracta de la lengua. Otra manera de referirnos a este fenómeno es decir que cada par de alófonos se agrupa para formar un fonema diferente o que los alófonos conforman un conjunto que es el fonema.
La función distintiva de estos fonemas se puede comprobar contrastando los pares de fonos. Por ejemplo, el par [ã ~ a] contrasta con el par [ũ ~ u]: mando [mãn̪d̪o] se distingue de mundo [mũn̪d̪o] y basto [bast̪o], de busto [bust̪o]. Las vocales orales contrastan con las orales y las nasalizadas contrastan con las nasalizadas. Es una especie de división del trabajo contrastivo: las vocales orales se ocupan del contraste en ciertos contextos y las nasalizadas se ocupan del contraste en otros contextos.
Resumiendo lo visto hasta el momento en nuestro curso, Cohn señala que dar cuenta del sistema fonológico de una lengua incluye, en primer lugar, consignar el inventario de sonidos que ocurren en ella. En segundo lugar, la descripción de un sistema fonológico debe mostrar qué sonidos se usan contrastivamente y cuáles son realizaciones de un mismo fonema. La distinción de estos dos tipos de uso supone examinar la distribución de los sonidos: aquellos que pueden contrastar significado aparecen en los mismos contextos fónicos y, por lo tanto, pueden formar pares mínimos; aquellos que no cumplen una función distintiva aparecen en contextos complementarios: donde aparece uno no aparece el otro y, por ende, nunca pueden formar un par mínimo de palabras. Como veremos más adelante en nuestro curso, dar cuenta de un sistema fonológico incluye también hacer explícitos los principios, reglas y restricciones que gobiernan la realización de los alófonos en sus contextos particulares.
En la sección previa y en esta, hemos examinado, respectivamente, el uso contrastivo y no contrastivo que les damos a los sonidos del habla en una lengua. Dado que dos sonidos pueden funcionar como alófonos, hemos visto la conveniencia de postular la noción de fonema como una unidad contrastiva más abstracta que los sonidos del habla. En la próxima sección, veremos la importancia de distinguir (1) las realizaciones o ejemplares sonoros concretos de (2) los fonos, entendidos como tipos de sonidos del habla; asimismo, veremos cómo estos se distinguen de (3) los fonemas de la lengua.