El trabajo del diccionario

Conferencia

En el marco del Seminario Permanente de Lingüística Aplicada del Departamento de Lingüística Aplicada de la ENALLT, y a través de su línea de investigación Lexicografía, Terminología y Traducción, el pasado 14 de mayo en el auditorio Rosario Castellanos, se llevó a cabo la conferencia El trabajo del diccionario, a cargo del Dr. Luis Fernando Lara, miembro de El Colegio de México y El Colegio Nacional.

En esta conferencia, el Dr. Lara habló del diccionario que ha dirigido desde hace muchos años y lo cambios que últimamente se han incorporado: Diccionario del español de México.

Dijo que la Lexicografía es una Lingüística Aplicada, y como lingüística aplicada proviene de una tradición práctica de muchísimos siglos incluso milenios. “Los primeros lexicógrafos en la historia del mundo -de los que sabemos- fueron, por ejemplo, babilonios que necesitaban escribir glosarios bilingües entre su lengua y otra de las lenguas del medio oriente de los pueblos con los que comerciaban”.

Así, la Lexicografía como práctica inició con los traductores, señaló.

Dijo que esta práctica se ha dado a lo largo de los siglos: “Nosotros formamos parte de una tradición. Es una tradición, en mucho, determinada por el hecho de que nuestro sistema de escritura se basa en el principio fonológico. Tenemos un sistema de escritura alfabético.”

No sería el mismo caso para el japonés o para el chino, en donde no se trata de sistemas de escritura alfabético y sus diccionarios son muy diferentes.

Apuntó que, en 1973, cuando inició el trabajo del Diccionario del español de México, “la práctica lexicográfica que conocíamos en aquella época y que además se sigue dando, era una práctica con muy poca reflexión lingüística.”

Explicó que alguien comenzaba su diccionario a partir de lo que se lo ocurría. “Si tenía una palabra adelante, pensaba cómo podía definir esta palabra o cómo podía glosarla, la apuntaba y listo, en el mejor de los casos”.

En el caso de la Lexicografía del español, señaló, todos los diccionarios, con dos o tres excepciones, que hoy se conocen del español, son copia del Diccionario de la Academia Española. “No es nuestro caso”.

“En el momento en que nosotros pensamos hacer un Diccionario del Español de México, lo primero era decir: no podemos copiar a la Academia Española, porque entonces estamos traicionando al español de México. El español de México es distinto. Y no sabemos realmente cómo sea el español de México”.

Entonces, destacó, si no sabemos cómo es, necesitamos empezar a investigarlo desde el comienzo para poder crear un diccionario que responda al español de los mexicanos. Que sea un diccionario original.

El Dr. Lara destacó que para poder hacer un Diccionario original era necesario establecer los criterios de la investigación y se trabajó sobre antecedentes lexicográficos, método y diseño de los diccionarios. “Esta investigación fue relativamente rápida y habíamos llegado a definir las características que le íbamos a dar a nuestro diccionario”.

El paso siguiente era “reunir un corpus de muchos datos que nos permitiera, de allí, sacar el vocabulario del español mexicano”, y después, “analizar textos”. Fue necesario construir un “analizador gramatical automático”.

En este punto, hizo referencia a los diccionarios de máquina utilizados en Italia, para decir que consistían en tomar un diccionario y diseñar un sistema de cotejo entre ese diccionario y los textos a analizar. “funcionaban bastante bien en italiano, también en francés”, pero advirtió, “si uno empieza a pensar en las variedades de las lenguas resulta que una variedad como la mexicana o cualquier hispanoamericana, no funcionaría muy bien tomando el Diccionario de la Academia como diccionario de máquina”.

Entonces se optó por el diseño de algoritmos, detalló: “que la computadora haga un reconocimiento automático de las palabras sin que le tengamos que decir qué palabras”. Así fue posible “procesar un corpus de 2 millones de ocurrencias de palabras en 8 meses”.

Al querer identificar las palabras más usuales y las menos usuales en México, también fue necesario un “sistema de cálculo estadístico”. Posteriormente se hizo un “aparato de documentación”.

Una vez elaborado todo esto, “pasamos al análisis automático”, y con el análisis automático, la computadora produjo “un conjunto de concordancias, es decir, para cada palabra identificada se tomaban 3 líneas de texto en las que éstas aparecían para tener el contexto”.

El contexto, explicó, “permite hacer el análisis semántico”. Por otro lado, “nos daba el cálculo numérico de qué tan usual es una palabra en México”.

Con estos resultados, comenzamos el análisis semántico y, después, la redacción del diccionario”.

El especialista destacó que el primer corpus del español mexicano contemporáneo abarcó un periodo de 1921 a 1974. “Acabamos de terminar el segundo corpus que cubre de 1975 a 2018 aunque no lo hemos dado a conocer”.

Mencionó que también se trabajó un corpus heterogéneo para conocer de qué hablaban los mexicanos basado en 13 géneros que abarcaban literatura, ciencias, periodismo, discurso político, discurso religioso, fotonovelas, telenovelas, radionovelas y caló. “Y les dimos distintos tamaños a los géneros porque pensábamos que de la literatura y de la ciencia obtendríamos más riqueza léxica”.

Hizo referencia al “analizador gramatical” y detalló que también se hicieron algoritmos para obtener los mejores resultados.

Más adelante, dijo que al tener identificadas “qué palabras se usan más en México -en todo México- y cuáles se usan menos, se constituyó la Nomenclatura del Diccionario”.

Una vez concluida la investigación, el redactor tiene frente a sí, todos estos datos. “El trabajo es muy lento para poder hacer todo el análisis de los usos, las construcciones y la redacción”.

Viene entonces el asunto semántico, señaló. “La definición lexicográfica no es una definición espontánea porque debe cumplir con ciertas reglas”. Primero, uno debe poder identificar cuál es la relación entre la palabra que constituye la entrada en el diccionario y su definición. Esta definición puede ser de dos maneras, a través de la ecuación sémica: mediante los verbos significar o ser.

Cuando la ecuación sémica es con significar lo que estamos buscando es qué significa la palabra para la gente. Cuando es con ser, lo que estamos buscando es qué es ese objeto nombrado por la palabra, explicó. “Los resultados son muy diferentes”

“El diccionario que seleccionar ser, es un diccionario enciclopédico o enciclopedia. El diccionario que selecciona significar es un diccionario de lengua. Nuestro Diccionario es un diccionario de lengua”.

“En la definición hay que poner lo que significa la palabra, nada más lo que significa y sólo lo que significa”, y “nunca consultar previamente otros diccionarios para que la definición sea completamente original”.

Una vez hecho el análisis, precisó, es necesario decidir de todos los diferentes significados encontrados para cada palabra, cuáles son radicalmente distintos para poder decir que se trata de homónimos; cuando hay rangos significativos compartidos se trata de una palabra polisémica.

El Dr. Lara afirmó que “lo que busca el diccionario es dar lugar a que el lector forme un esquema taxonómico que lo vaya conduciendo a lo largo de las acepciones en la búsqueda que está haciendo a propósito del significado de esa palabra en el texto que está leyendo”.

“Hacemos el marco del artículo lexicográfico, ordenamos las acepciones y después tenemos que buscar ejemplos”, porque los ejemplos le permiten al lector entender mucho mejor lo que dice la definición.

En el proceso, continúa un revisor que repite todo como si no hubiera un antecedente, coteja y se da por aceptado el artículo. “Entonces pasa al acervo de artículos para el diccionario”.

El Dr. Lara expresó que es en el diccionario donde mejor se ve esta necesaria implicación entre la Lingüística como tal y la Lingüística Aplicada.

El Diccionario del español en México está disponible para su consulta en la página del COLMEX.