El modelo teórico conocido como “fonología autosegmental” y, en sus desarrollos posteriores, como “geometría de rasgos” propone que los segmentos se caracterizan por una estructura más compleja que, simplemente, un conjunto de rasgos sin orden alguno, como proponía el modelo de Chomsky y Halle (1968). En este modelo, cada segmento es una matriz de rasgos sin ninguna estructura. Para la fonología autosegmental, en cambio, los rasgos que conforman los segmentos tienen cierta autonomía unos de otros, de modo que el segmento se concibe como una estructura de rasgos, antes que como un “paquete” de rasgos. Los rasgos se encuentran organizados en diferentes niveles de acuerdo con su tipo.
Este cambio en la concepción de la estructura de los segmentos se conoce como el paso de una fonología unilineal, en la que un morfema se concibe como una secuencia de segmentos (una sola línea de segmentos), a una fonología multilineal, en la que los morfemas se conciben como secuencias de segmentos conformados por rasgos que ocupan niveles diferentes (varias líneas de rasgos autónomos o “autosegmentos”). El siguiente texto de John Goldsmith, quien propone este modelo teórico, presenta esta idea:
Texto 1
“Lo que distingue la fonología autosegmental de la fonología generativa del tipo del Sound Pattern of English es, en primer lugar, el desarrollo de un análisis fonológico multilineal en el que diferentes rasgos se localizan en niveles separados, y en el que los diversos niveles están organizados por “líneas de asociación” y una Condición de Buena Formación; y, en segundo lugar, un análisis de los fenómenos fonológicos, menos en términos de reglas que cambian los rasgos, y más en términos de reglas que eliden y reorganizan los diversos autosegmentos, a través del reajuste de las líneas de asociación”.
J. GOLDSMITH, “The Aims of Autosegmental Phonology”, p. 202.
Como se lee en este texto, la teoría de la fonología autosegmental también propone que los procesos fonológicos, que, como hemos visto, para la fonología generativa son de naturaleza cognitiva, no dependen de reglas que cambian unos rasgos por otros, sino de reglas que desvinculan rasgos de las representaciones subyacentes o asocian rasgos entre segmentos adyacentes. Es decir que los procesos fonológicos se entienden como más dependientes de las representaciones fonológicas que en el modelo unilineal, en el que las reglas modifican los rasgos de una matriz. El siguiente texto de Goldsmith aclara este punto:
Texto 2
“El objetivo (…) de la fonología autosegmental es dar cuenta de las consecuencias, para la fonología generativa, de las representaciones y análisis fonológicos multilineales. Esto es, abandonamos la asunción de que las representaciones fonológicas y fonéticas consisten en una sola hilera, o concatenación, de segmentos. En su lugar, proponemos formas subyacentes y superficiales que consisten en hileras paralelas de segmentos organizados en dos o más niveles. Los rasgos están distribuidos en los distintos niveles en el sentido de que ningún rasgo puede aparecer en más de un nivel. Esta representación fonológica más rica sirve como base para un análisis fonológico formal más iluminador y, en última instancia, más simple”.
J. GOLDSMITH, “The Aims of Autosegmental Phonology”, p. 203.
El diseño general de la fonología generativa se mantiene. Los hablantes registramos en nuestro léxico mental solo la información fonológica impredecible de los morfemas, es decir, su representación subyacente. La representación subyacente se deriva a una representación superficial mediante la aplicación de reglas fonológicas, reglas de redundancia y reglas por defecto. La representación superficial sirve como las instrucciones que le proporcionamos a nuestro aparato fonador al hablar.
La idea de proponer un modelo fonológico nuevo surge de las insuficiencias del modelo tradicional del SPE para describir y explicar de manera satisfactoria un conjunto de fenómenos fonológicos. Esta es la dinámica que caracteriza a la ciencia: una teoría se propone para explicar un conjunto de fenómenos; si existen algunos fenómenos que la teoría no puede explicar de manera satisfactoria, esta debe modificarse para que pueda dar cuenta de ellos, sin dejar de explicar aquellos fenómenos de los que ya daba cuenta. Esto es lo que ocurre con el paso de la fonología unilineal a la fonología multilineal: la primera encuentra problemas para explicar una serie de fenómenos prosódicos o suprasegmentales de los que la segunda da cuenta de manera satisfactoria. Sin embargo, la nueva teoría también debe dar cuenta del conjunto de fenómenos que la teoría anterior explicaba. Y si lo hace de una manera más satisfactoria, tanto mejor.
El siguiente texto de Goldsmith presenta el problema que motivó la postulación de la teoría autosegmental:
Texto 3
“La propuesta autosegmental surgió a partir de ciertos problemas que el trabajo de Williams y Leben hizo salir a la luz explícita o implícitamente. El problema más obvio era la naturaleza de las vocales “con tono de contorno” —esto es, vocales cuyo tono superficial es ascendente o descendente, situación que muchas veces se puede mostrar que es el resultado de la concatenación de un tono de nivel bajo y de otro alto—. ¿Cómo podía un solo segmento portar o llevar dos especificaciones tonales en secuencia?”.
J. GOLDSMITH, “The Aims of Autosegmental Phonology”, pp. 204-205.
Las lenguas tonales utilizan diferentes patrones de tonalidad para codificar información léxica o gramatical. El siguiente ejemplo de la lengua ewe muestra cómo la misma secuencia de segmentos conforma tres morfemas distintos si va acompañada de un tono alto, un tono bajo y un tono ascendente.
De acuerdo con el modelo de segmento que hemos venido estudiando, estas palabras serían secuencias de matrices o conjuntos de rasgos sin ninguna organización interna. Cada segmento es, sencillamente, el conjunto de rasgos que lo conforman. Si el segmento está compuesto, además de por rasgos segmentales (de timbre), por algún rasgo suprasegmental (como el acento o el tono), pues este rasgo forma parte del conjunto de la misma manera que los demás.
El esquema que aparece a continuación pretende respresentar las tres palabras del ewe que vimos antes. El segmento [t] aparece representado por el símbolo del Alfabeto Fonético Internacional y las vocales se representan como matrices de rasgos que, crucialmente, incluyen un rasgo de tono (en rojo).
Esta representación no explicita ninguna relación entre los tres tonos: son concebidos como propiedades autónomas que conforman los segmentos. Sin embargo, el siguiente fenómeno de la lengua margi (tomado de Kenstowicz 1994) sugiere que el tono ascendente resulta de la combinación secuencial del tono bajo y el tono alto.
El sufijo definido /-árì/ presenta subyacentemente un tono alto en su primera vocal, como sugieren los primeros cinco ejemplos del corpus anterior. En los últimos tres ejemplos, sin embargo, la primera vocal del sufijo aparece con un tono ascendente. Esto se puede explicar de la siguiente manera: la vocal final de la raíz a la que se adosa el sufijo ha perdido su tono bajo al pronunciarse como un glide y este tono se ha juntado con el tono alto formando una secuencia que escuchamos como un tono ascendente. En otras palabras, el tono ascedente no es un tercer rasgo diferente de los tonos alto y bajo (como sugiere la representación de los morfemas del ewe que vimos arriba), sino una combinación secuencial de estos.
Esta propuesta no se puede representar con el modelo tradicional del segmento como un paquete de rasgos, pues no admite la representación de secuencias ni la vinculación de la información de un segmento con la de otro. En cambio, una representación autosegmental, en la que el rasgo o la información de tono sea independiente de la información de timbre (aunque asociada), sí permite hacerlo, como muestra el siguiente esquema, que representa la derivación de la expresión [tj-ǎrì]. 'mañana'.
La primera fase de la derivación presenta la información de la vocal [ì] de la raíz separada en dos niveles vinculados por una línea de asociación: el nivel de la información segmental o de timbre (aquí aparece plenamente especificada para facilitar la identificación de la vocal [ì]) y el nivel de la información suprasegmental de tipo tonal. Lo mismo ocurre con la vocal [á] de la raíz. La segunda fase de la derivación muestra la conversión de la vocal de la raíz en glide, lo que trae como consecuencia la desasociación del segmento y del rasgo de tono bajo la asunción de que los tonos solo pueden estar asociados a un núcleo silábico.
La tercera fase de la derivación representa, mediante una línea discontinua, la reasociación del tono que queda "flotante" a la vocal siguiente [á]. Finalmente, la cuarta fase de la derivación muestra la información segmental de la vocal asociada a una secuencia de tonos bajo-alto, secuencia que se escucha como un tono ascendente. El modelo de la fonología unilineal no puede representar este fenómeno de manera tan simple, por lo que la fonología autosegmental se considera preferible.
La siguiente imagen tomada del artículo de Clements y Hume (1995) "La organización interna de los sonidos del habla" muestra las posibilidades de vinculación de estos dos niveles autónomos de información fonológica. La letra "V" corresponde a "vocal" y representa la información de timbre o segmental; la letra "L" simboliza la palabra inglesa "low" 'bajo' y representa el tono bajo; la letra "H" está por la palabra inglesa "high" 'alto' y representa el tono alto.
El esquema (a) muestra la asociación de uno a uno entre unidades de ambos niveles. El esquema (b) muestra la posibilidad de tener una vocal asociada a dos tonos; específicamente, simboliza un tono descendente (opuesto al que hemos visto en ewe y margi). El esquema (c) presenta la situación contraria: dos vocales que comparten un mismo tono, es decir, que se pronuncian seguidas sin variar el tono que las acompaña. Finalmente, el esquema (d) muestra la posibilidad de que un tono no esté asociado al nivel segmental; esto es lo que vimos que ocurre en margi, durante la derivación, cuando la vocal pasa a ser un glide.
Al igual que los fenómenos relacionados con el tono sugieren la existencia de dos niveles autónomos —uno de timbre y uno de tono—, hay otros fenómenos que sugieren que a la cantidad o duración de los segmentos también le corresponde un nivel particular. En este caso, en lugar de los rasgos tradicionales [+largo / -largo], que en la fonología unilineal se incluían en la matriz, se propone que la cantidad depende de unidades de tiempo asociadas al nivel del timbre: una consonante o una vocal breves están asociadas a una sola unidad de tiempo, mientras que una vocal larga o una consonante geminada están asociadas a dos unidades de tiempo. Los siguientes esquemas representan una vocal breve y una larga, respectivamente.
Una ventaja de la representación autosegmental de la duración es que permite describir de manera simple el fenómeno de alargamiento compensatorio que se encuentra en algunas lenguas. El fenómeno consiste en la elisión de algún segmento presente en la representación subyacente de una palabra y en la pronunciación con mayor duración de algún segmento del contexto. Por ejemplo, en castellano, utilizando un registro informal, podemos pronunciar la palabra cansado como [kansaːo]. Podemos asumir que la representación subyacente de esta palabra es /kansado/ y que se ha elidido el segmento /d/. Sin embargo, pareciera que algo de este segmento ha quedado: el tiempo que toma pronunciarlo permanece de alguna manera en la realización más larga de [aː].
La variedad de castellano hablado en Cuba presenta un fenómeno similar con algunas consonantes. La palabra puerco, por ejemplo, se pronuncia [pwekːo] y la palabra carne se pronuncia [kanːe]. En este caso, la consonante /ɾ/ en posición de final de sílaba se elide y la consonante siguiente se pronuncia larga. Esta derivación se puede representar con el esquema que aparece a continuación. La primera figura representa la secuencia /ɾk/ de puerco o la secuencia /ɾn/ de carne. La segunda representa la desvinculación de la unidad de tiempo y la información de timbre de /ɾ/, que conducirá a la elisión del segmento, lo que se muestra en la tercera figura, en la que solo aparece la unidad de tiempo flotante. La cuarta figura muestra la reasociación de la unidad de tiempo flotante a la unidad segmental siguiente, es decir, a /k/ en el caso de puerco y a /n/ en el caso de carne. La última figura muestra el resultado de la derivación: una consonante vinculada a dos unidades de tiempo.
La representación autosegmental de la duración o cantidad también nos permite entender de manera muy simple un fenómeno morfológico del quechua central del Perú. Los siguientes corpus del quechua cuzqueño y del quechua wanka ilustran la manera en que se codifica la primera persona posesora en estas variedades.
Como se puede observar, en la variedad sureña, la codificación se realiza mediante la sufijación del morfema /-j/ a la raíz, mientras que, en la variedad central, la codificación es mediante el alargamiento de la vocal final de la raíz, dos fenómenos, aparentemente, muy dispares para dos variedades de una misma lengua.
Ahora bien, la fonología autosegmental nos permite entender que estos dos procesos morfológicos, en realidad, no son tan diferentes, pues en ambos casos ocurre una sufijación. La diferencia es que en el quechua cuzqueño se sufija una unidad de tiempo asociada a la información segmental de [j], mientras que en el quechua wanka solo se sufija una unidad de tiempo, la cual se asocia a la información segmental de la vocal de la raíz (o al sufijo /-ni/, en caso de estar presente), dando como resultado una vocal larga. La principal diferencia es que, en el quechua sureño, el sufijo consta de información segmental y de información temporal, mientras que en el quechua wanka el sufija consta solamente de una unidad de tiempo. Los siguientes esquemas ilustran estos procesos.
El modelo de la fonología autosegmental empezó a ser utilizado para estudiar otras unidades o fenómenos fonológicos. La posibilidad de representar secuencias de tonos (o tonos "de contorno"), como la que vimos arriba, motivó el estudio de los segmentos de contorno, es decir, de aquellos que presentan una secuencia de dos valores opuestos de un rasgo. Los ejemplos más conocidos de estos segmentos son las consonantes prenasalizadas y postnasalizadas, así como las consonantes africadas.
Las consonantes prenasalizadas, como [nd], empiezan con una pronunciación nasal y terminan con una pronunciación oral, mientras que los segmentos postnasalizados, como [dn], se articulan de la manera contraria. A diferencia de la fonología lineal, la fonología multilineal sí permite representar un segmento que presenta un secuencia de dos valores distintos de un mismo rasgo, en este caso del rasgo [+nasal / -nasal]. El siguiente esquema, tomado de Clements y Hume (1995), representa parcialmente una consonante prenasalizada.
El símbolo "X" en la parte superior corresponde a una unidad de tiempo, lo que sugiere que se trata de un solo segmento formado por dos unidades al nivel de la información del timbre. El término "root" 'raíz' sugiere que este último tipo de información también tiene estructura autosegmental; esto lo veremos en la siguiente sección. Por ahora, para entender la estructura del segmento de contorno, basta con notar que, en una sola unidad de tiempo, se realiza una articulación [+nasal] seguida de una articulación [-nasal]: [nd].
Clements y Hume (1995: 254) afirman que los fenómenos más convincentes para postular este tipo de estructura para los segmentos de contorno son los llamados “efectos de extremo” (edge effects), que sugieren que, por ejemplo, un segmento prenasalizado se comporta como una nasal con respecto al segmento previo y como una no nasal con respecto al segmento siguiente. Sin embargo, los autores también señalan que estos fenómenos no son muy convincentes en lo que respecta a las africadas, de modo que “el análisis formal de las africadas continúa siendo una cuestión no resuelta en la actualidad”. Dado que las consonantes africadas empiezan con una oclusión y terminan con una liberación del aire con fricción, la secuencia de rasgos que las caracteriza debería ser [– continuo] - [+ continuo]. No obstante, como indican los autores, no hay evidencia concluyente que muestre que este tipo de segmentos se comporta como una oclusiva con los segmentos previos y como una fricativa con los segmentos siguientes.
En la siguiente sección, presentaremos un desarrollo de la idea de que los segmentos constan de unidades autosegmentales vinculadas por líneas de asociación. Se trata de la propuesta de la geometría de rasgos, que postula que la información fonológica del timbre de los segmentos se encuentra organizada jerárquicamente.