MT traducción de computadora

Los traductores veían escépticos el potencial de los traductores de computadora, Machine Translation, MT, y lo pensaban en un futuro muy lejano.

Pero resulta que ya está aquí.

Aunque es poco probable que sea aplicable al marketing, a leyes, a ciencias, etcétera, sin la asesoría de un traductor experto, después de 70 años de altos y bajos el MT está ahora en auge como nunca antes.

Cuando las reglas fueron escritas en un intento de mapear los sistemas de lenguaje enteros en sí, el éxito fue moderado, y el esfuerzo colosal. Y cuando se buscó un mecanismo "interlingua" independiente del lenguaje en un intento para que el significado de cualquier mensaje se abstrajera de la expresión del lenguaje, también falló.

Pero hoy estamos en la era de la estadística. Hay muchas ​​matemáticas en MT pero en esencia hay un mecanismo estadístico de MT (SMT), uno que aprende cómo traducir adecuadamente (es decir, preservar el significado) y la fluidez (es decir, en buen idioma de destino) a partir de datos que está entrenados en: corpus bilingüe para el modelo de traducción y corpus monolingüe para el modelo de lenguaje (destino). ¿Cómo ocurre este entrenamiento? Básicamente, las palabras y la secuencias de las palabras (la técnica SMT es basada en la frase) en el lado del idioma fuente de un corpus son emparejados con los candidatos destino del idioma destino; los pares ganadores son los que presentan la frecuencia más elevada. Entonces, cuando traduce, este modelo matemático de traducción asigna probabilidades a las posibles traducciones de las palabras y frases que se encuentran en los nuevos textos de origen.

SMT funciona mejor entre idiomas con sintaxis similar y no funciona tan bien cuando la morfología del idioma destino es considerablemente más compleja que la de la lengua fuente. Para tener en cuenta patrones divergentes de lenguaje, las estadísticas suelen complementarse con normas: entonces se trata de motores de MT híbridos.

En consecuencia, cuanto más se superpone en la formación de datos (por ejemplo, las fórmulas más usadas en textos), más precisos serán los resultados, más, mejor, mejores serán los datos de entrenamiento (es decir, las traducciones producidas por el hombre), mejor será la salida.

Parece que hemos llegado a la etapa en la que todas estas condiciones se pueden cumplir muy bien: MT está cosechando los beneficios de más o menos dos décadas de producción y almacenamiento de memorias de traducción intensiva y tiene los medios para aprovechar al máximo las enormes cantidades de datos que se han ido acumulando en la Web (piense en todos los datos que tiene acceso el traductor de Google).

La MT siempre dependerá de las necesidades del usuario. Una cosa es cierta: los traductores profesionales pueden estar seguros de que la última palabra sigue siendo la suya.

La unión europea lo tienen, los gobiernos la utilizan, los proveedores especializados ofrecen ahora los motores adaptados a la medida de las necesidades de traducción de sus clientes. Definitivamente, MT ya no es sólo un área fascinante de la investigación: es aquí para quedarse.

EGM

6/14/2013