abril 2012 ~ Mundos binarios de Babel

sábado, 28 de abril de 2012

Términos claves de Informática Aplicada a la Traducción (II)

Términos más específicos relacionados con las memorias de traducción

Tras una primera entrada de conceptos más generales de Informática aplicada a la traducción, voy a proseguir con términos más específicos que tienen que ver con las memorias de traducción. Como ya expliqué en qué consiste una memoria de traducción (ver término 9 de dicha entrada), voy a pasar a definir los siguientes términos:

12. Coincidencias totales y coincidencias parciales o fuzzy matching

El programa de memorias de traducción contiene una memoria de traducción dividida en una serie de segmentos en lengua origen, que están almacenados junto a su correspondiente equivalente en lengua meta (ver términos 10 y 11). Así, cuando se está traduciendo un texto nuevo, dicho programa realiza una búsqueda para localizar aquellos segmentos del texto nuevo que ya se hayan traducido previamente y que, por lo tanto, se encuentren almacenados en la memoria.

Si ya hay un segmento almacenado en la memoria que es prácticamente (o exactamente) igual al segmento nuevo, se habla de coincidencias totales. Si la coincidencia es solo parcial, se habla de fuzzy matching.

12. 1. Umbral de sensibilidad

Además, puede indicársele al programa que aplique un determinado umbral de sensibilidad en la búsqueda de coincidencias; se aplica un grado que puede ir de 0 a 100 y que, por defecto, suele ser de un 75% dado que, si se es demasiado exigente con el programa y se le pide que encuentre coincidencias exactas, será muy poco probable que las encuentre (y habrá demasiado silencio, en contraposición al ruido, que se dará cuando el umbral sea demasiado bajo y, por lo tanto, aparezcan demasiados resultados; es lo mismo que ocurre cuando se realiza una búsqueda en un motor de búsqueda).

13. Autopropagación

De esta forma, en el programa de memorias de traducción puede activarse la opción de autopropagación (esto puede hacerse, por ejemplo, en Déjà Vu), de forma que, si un determinado segmento ya se ha traducido y vuelve a aparecer en el texto que se está traduciendo, el programa introducirá la traducción que ya se haya realizado (esto es especialmente útil en el caso de textos muy repetitivos, puesto que le ahorra mucho tiempo al traductor y le asegura que será coherente en su traducción).

De esta y de otras funciones básicas de cualquier sistema de memoria de traducción hablo en Traducir mediante una memoria de traducción: funciones y herramientas básicas.

13.1. Autocomprobación

Además, el programa de memoria de traducción va comprobando que la traducción de los segmentos que realiza el traductor se corresponde con la que tiene almacenada (si no, como en el caso de Déjà Vu, el programa avisa al traductor mediante un signo de exclamación en rojo).

14. Unidad de traducción

Este concepto es bastante abstracto, puesto que la unidad de traducción se corresponde con el segmento que se traduce. En otras palabras, la unidad de traducción puede abarcar desde una palabra hasta una oración entera (e incluso los hay que afirman que traducimos textos y no palabras ni oraciones). En cualquier caso, para los sistemas de memorias de traducción, la unidad de traducción es el segmento, como ya expliqué (ver 11).

Hablar de «unidad de traducción» nos lleva a «afinar» un poco más en cuanto a los términos que van a definirse, es decir, a ser más específicos y a centrarnos en unidades de traducción más pequeñas, como pueden ser las palabras, cuya traducción correcta (teniendo en cuenta el contexto en cada caso) hay que conocer e indicar al programa:

15. Término

Como ya he dicho en varias ocasiones, tras dos asignaturas de Terminología, la definición de término no supone ninguna dificultad. Como ya definí en la entrada La importancia de la terminología en los programas de memoria de traducción, un término es una unidad léxica compuesta por una o más palabras que adquiere su significación en función de un ámbito determinado; en muchas ocasiones, de hecho, solo en función del contexto sabremos el significado y la acepción de un término dado.

Para ello es fundamental realizar una extracción terminológica, en la que conviene indicar las distintas traducciones de los términos en función de su contexto de uso.

15.1. Extracción terminológica

También a la extracción terminológica le dediqué una entrada, por lo que solo diré que consiste en recopilar de una serie de textos especializados aquellas palabras que puedan considerarse términos. Esto se puede hacer de forma automática mediante programas como Lexterm o mediante el que incluye Déjà Vu y, aunque no lo parezca, ahorrará mucho tiempo al traductor cuando esté realizando la traducción, además de que le asegurará una coherencia interna en su trabajo, como no me he cansado de repetir.

Para un análisis más detallado de la extracción terminológica, así como de sus ventajas, ver La importancia de la terminología en los programas de memoria de traducción y La extracción de términos.

15.1.1. Las stopwords

A propósito de la extracción terminológica, conviene recordar un término muy relacionado, el de stopword, aquellas palabras que están vacías de contenido. Cuando el programa realiza una extracción terminológica automática, puede marcarse como preferencia que no incluya dichas palabras en su extracción (en internet hay muchos listados de estas palabras, además de que muchos programas de extracción terminológica las incluyen; es el caso de Lexterm).

Aun a riesgo de repetirme, para más información sobre las stopwords, puede consultarse la entrada anteriormente citada La extracción de términos.

Volvamos ahora a ampliar un poco la cuestión de las palabras y de los términos. ¿En qué tipo de listas se incluyen?

16. Base de datos terminológica

Una base de datos terminológica es, simplemente, una base de datos (esto es, un contenedor de datos) que incluye una serie de términos recopilados por pares, es decir, incluye el término original junto a su traducción y, lo que es más importante, también incluye su contexto, el ámbito en el que se utiliza (ya he insistido en varias ocasiones en la importancia del contexto en la traducción de términos).

Asimismo, la base de datos terminológica puede ser multilingüe (es decir, incluir la traducción correspondiente del término en más de un idioma) y multiámbito (dado que un mismo término puede tener distintas acepciones según el contexto del uso, por lo que es de gran importancia que esto esté bien indicado en la base de datos terminológica).

Una vez más, de estos temas hablo en La importancia de la terminología en los programas de memoria de traducción.

17. Léxico, lexicón

Un léxico, por lo tanto, sería una base de datos terminológica ad hoc, esto es, creada para un proyecto de traducción determinado. Así, una vez que se finalice el proyecto, dicho léxico pasaría a formar parte de la base de datos terminológica. Dado que es un glosario ad hoc, no hace falta incluir el ámbito de uso, puesto que en un proyecto de traducción determinado solo habrá un contexto.

Un lexicón es lo mismo que el léxico, aunque el término lexicón se utiliza con más frecuencia, a mi juicio, en lo relativo a la traducción automática y asistida.

También al léxico y al lexicón les dedico la entrada La importancia de la terminología en los programas de memoria de traducción y La extracción de términos.

18. Autobúsqueda

Muy relacionada con los términos anteriores está la función de autobúsqueda que ofrecen los sistemas de memorias de traducción (como Déjà Vu, sin ir más lejos). Si esta opción está activada, el sistema buscará de forma automática si existe algo aprovechable en las distintas bases de datos (memorias de traducción, bases de datos terminológicas, lexicones...), esto es, si puede utilizar traducciones de segmentos o de términos ya realizadas en el texto que se está traduciendo (una vez más, esto asegura la coherencia del trabajo del traductor).

Para una explicación de la autobúsqueda más «en contexto», ver, una vez más, La importancia de la terminología en los programas de memoria de traducción.

19. Deep mining

Retomo los conceptos de autopropagación (13) y autobúsqueda (18) para explicar brevemente en qué consiste el deep mining. Se trata, simplemente, de una búsqueda inteligente: a partir de las distintas fuentes de las que dispone (memorias de traducción, bases de datos terminológicas, lexicones..), el programa realiza una autobúsqueda y, empleando distintos segmentos, el propio programa es el que propone una traducción, es decir, que es el propio programa el que deduce la traducción del segmento nuevo.

A propósito del deep mining, puede leerse la entrada Deep mining with Déjà Vu X2.

20. Autoensamblaje

Lo contrario al deep mining sería el autoensamblaje: el programa solo introduce los resultados de distintos segmentos, sin deducir ni intuir cuál podría ser la traducción del segmento nuevo (que se diferencia de la autopropagación, ver 13, dado que esta se aplica en el caso de coincidencias totales de segmentos).

21. Principales formatos o extensiones que un traductor debe conocer

Para terminar con esta entrada, me gustaría indicar brevemente las principales extensiones que un traductor que esté trabajando con sistemas de memorias de traducción debe conocer (por ejemplo, a la hora de importar un determinado archivo al proyecto de traducción o al buscar un determinado archivo exportado del proyecto de traducción). No hablo ya del .doc(x) o del .jpg, puesto que doy por hecho que eso ya es de sobra conocido, por lo que pasaré a explicar otros más específicos con los que me he encontrado durante el desarrollo de la asignatura y, especialmente, al utilizar el programa Déjà Vu.

21.1. tmx

Formato estándar para las memorias de traducción que permite que dichas memorias puedan intercambiarse entre distintos programas de memorias de traducción sin que haya problemas de compatibilidad. Es el acrónimo de Translation Memory eXchange.

En el .tmx pueden encontrarse dos tipos de informaciones, etiquetas y contenidos. Las etiquetas dan información y van asociadas a una serie de parámetros y variables, suelen ser dobles (es decir, hay una de apertura, < >, y otra de cierre, </ >) y están escritas en lenguaje html. Los contenidos son toda la información que se encuentra incluida en dichas etiquetas.

Para más información, ver El formato .tmx y el lenguaje html.

Las siguientes extensiones son propias del programa Déjà Vu. Aunque a simple vista parezcan complicadas de reconocer, son muy fáciles de deducir. Como es lógico, solo se pueden abrir con dicho programa.

21.2. dvprj

Esta extensión corresponde al proyecto de traducción de Déjà Vu (dv es Déjà Vu y prj, project).

21.3. dvmdb

Esta extensión corresponde a la memoria de traducción de Déjà Vu (Déjà Vu Memory DataBase).

21.4. dvmdx

El archivo que tiene esta extensión contiene otro tipo de información, tales como el nombre del proyecto y de los archivos.

21.5. dvmdi

Los archivos que están guardados con esta extensión corresponden a cada una de las lenguas con las que se está trabajando en el proyecto. Así, si se está trabajando con el inglés (como lengua origen, por ejemplo) y con el español (como lengua meta, por ejemplo), habrá dos archivos distintos con dos extensiones distintas, .en.dvmdi (inglés) y .es.dvmdi (español).

21.6. dvtdb

Este formato indica que se trata de una base de datos de terminología de Déjà Vu (Déjà Vu Terminology DataBase).

Para más información sobre las extensiones mencionadas arriba, ver Déjà Vu X Professional. Guía de introducción al uso y 12 facts, hints and ideas on databases in DVX2.

viernes, 27 de abril de 2012

El sistema de traducción automática de Google Translate cumple seis años

El sistema de traducción automática de Google, Google Translate, lleva ya seis años «derribando las barreras del lenguaje»

Dado que no tengo mucho más que añadir sobre este sistema de traducción (de él hablé en esta entrada y, sobre todo, en esta otra entrada), prefiero reflexionar sobre lo que comentan los miembros del equipo de este sistema de traducción automática(1). Ahora mismo, explican, tenemos todo el conocimiento del mundo «en la yema de los dedos»; sin embargo, ¿qué ocurre si ese contenido está en idiomas que no conocemos? No se trata tanto de conseguir una buena traducción como de poder entender el contenido de determinadas páginas webs, por lo que la mejor opción es recurrir a traductores automáticos y, entre estos traductores, hay que reconocer que Google Translate destaca por su calidad (su situación ha cambiado con respecto a hace unos años, cuando gozaba de peor fama).

En el blog de Google se explica que este servicio comenzó en 2001 con solo unos cuantos idiomas; sin embargo, como acabo de decir, sus resultados eran bastante deficientes, por lo que decidieron incluir más idiomas en el servicio y se dedicaron a investigar más a fondo a propósito de la evaluación de las traducciones informáticas (una explicación más completa del desarrollo de Google Translate la tenéis en el ya citado blog).

Hoy en día, gracias al trabajo empleado en este proyecto (y también a la colaboración desinteresada de un gran número de usuarios; para más información, ver la entrada de El crowd-sourcing), los servicios de Google Translate los utilizan tantas personas que, continúan los miembros del equipo, en un día se traduce una cantidad de texto equivalente a lo que contendrían un millón de libros. Además, añaden, lo que todos los traductores humanos profesionales traducen en un año, el sistema de Google Translate lo traduce en un día. Ahí debo decir en nuestra defensa que la calidad de las traducciones automáticas nunca será igual que la de las traducciones realizadas por traductores humanos; sin embargo, hay que admitir que estos datos no son nada alentadores... Es verdad que ellos mismos no censuran en absoluto la tarea del traductor humano:

Of course, for nuanced or mission-critical translations, nothing beats a human translator—and we believe that as machine translation encourages people to speak their own languages more and carry on more global conversations, translation experts will be more crucial than ever.(2)

Está claro que Google Translate no parará hasta acabar definitivamente con las barreras del lenguaje, puesto que incluso ya puede verse este servicio en el portal de vídeos Youtube...

¿Qué ocurrirá de aquí a seis años?... El tiempo lo dirá.

________________________________

(1)«Breaking down the language barrier―six years in» en Google. Official Blog, accesible en: http://googleblog.blogspot.com.es/2012/04/breaking-down-language-barriersix-years.html [Consulta: 27/IV/2012]
(2)Vid. nota 1.

martes, 24 de abril de 2012

Términos claves de Informática Aplicada a la Traducción (I)

Términos generales e introductorios a la asignatura

sábado, 21 de abril de 2012

La importancia de la terminología en los programas de memorias de traducción

En una entrada anterior hablé sobre la extracción de términos mediante el programa de código abierto Lexterm; sin embargo, no incidí demasiado en la importancia de la terminología en los programas de memorias de traducción, puesto que me centré exclusivamente en el proceso de extracción terminológica, que también es de gran importancia para los programas de memorias de traducción. Este es el motivo de la presente entrada.

Como dije en la entrada anterior (Traducir mediante una memoria de traducción: funciones y herramientas básicas), en cualquier proyecto de traducción son necesarios tres componentes: un proyecto, una memoria de traducción y una base de datos terminológica; estos tres elementos, como ya dije, están relacionados. La terminología (que es el tema que nos ocupa ahora) depende de la situación concreta del proyecto de traducción, así como del tipo (es decir, el tema o el ámbito al que pertenece, el cliente que lo ha encargado...).

¿Qué es un término?

A modo de introducción, me gustaría responder a la pregunta que encabeza este apartado: ¿qué es un término? A estas alturas de la carrera y después de dos asignaturas de Terminología, esto ya no nos parece algo nuevo. Sin embargo, creo que conviene recordarlo: un término, tal y como vimos en clase, es una unidad léxica compuesta por una o más palabras que adquiere su significación en función de un ámbito determinado. Es fundamental tener en cuenta el ámbito al que pertenecen dichos términos, pues es ahí donde se especializan y donde adquieren su significado; además, este significado (y, por lo tanto, la traducción) de un término puede variar en función de su contexto de uso, por lo que es necesario que el ámbito al que pertenecen los términos esté perfectamente delimitado.

De hecho, he de decir que los sistemas de memorias de traducción son mucho más productivos cuando se utilizan lenguajes especializados, pues es ahí donde entra en juego la terminología y es ahí donde los resultados del programa de memorias de traducción pueden mejorar.

¿Cuál es la utilidad de la terminología en las memorias de traducción?

Sin embargo, los sistemas de memorias de traducción no son automáticos (a pesar de que sean capaces de realizar una traducción que podríamos considerar semiautomática), por lo que el usuario es clave para cerciorarse de la calidad de la lista de términos que hayan propuesto estos sistemas (insisto en que de la extracción terminológica ya hablé de forma, creo, exhaustiva).

Una vez que se haya insertado la lista de términos en el sistema, este puede utilizarla de tres formas: en primer lugar, para que el traductor vaya realizando su propia traducción (una traducción humana/automática, donde el sistema se encarga de comparar la traducción automática de determinados términos con la que contiene en su propia base de datos, descartando aquellas traducciones que no tenga almacenadas); en segundo lugar, para que el traductor automático utilice estos términos para hacer su propia traducción (traducción conocida como semiautomática o como autoensamblaje, en la que el sistema propone la traducción solo de determinados fragmentos, pues traduce lo que tiene almacenado y lo que no traduce lo deja en inglés, y es esto lo que tiene que completar el traductor) y, en tercer lugar, para que el sistema las utilice para proponer candidatos de traducción.

La terminología resulta fundamental para el traductor, puesto que le garantiza una coherencia interna (evitándole así al lector una confusión debida a una incoherencia en la traducción de un determinado término). Además, si el sistema contiene una buena terminología, le avisará al traductor cuando este no traduzca como se ha establecido en dicha base de datos (lo cual redunda en lo primero, es decir, le garantiza una coherencia interna). De hecho, Déjà Vu cuenta con una opción, Check terminology, que comprueba todos los términos de su propia base de datos y marca los segmentos en los que no se ha traducido un término como debería haberse traducido.

¿Bases de datos terminológicas, léxicos, lexicones...?

Ahora bien, los programas de este tipo tienen tres bases de datos distintas: una memoria de traducción, una base de datos de términos y un léxico, que ayudan al traductor a realizar su trabajo. Una base de datos terminológica sería similar a una base de datos, con la diferencia de que los términos que contienen están recopilados por pares (es decir, el original se almacena junto a su traducción) y se incluyen los campos y ámbitos en los que se utilizan(1) (la base de datos terminológica, además, puede ser multilingüe y multiámbito). Es importante que la terminología esté bien gestionada y que las traducciones propuestas, así como los ámbitos a los que pertenece cada término, sean los adecuados.

¿Y qué es, entonces, un léxico? El léxico es un glosario de trabajo para un proyecto determinado que tiene una vida determinada; recalco que es determinado porque se trata de un glosario ad hoc, es decir, para un proyecto de traducción determinado: cuando finalice dicho proyecto, ya no será necesario su correspondiente léxico, por lo que podrá importarse a la base de datos terminológica para, así, completarla. También se les conoce como lexicones, aunque este concepto lo he visto más en el ámbito de la traducción automática...; en todo caso, son sinónimos.

Es importante tener claros estos conceptos, así como la característica fundamental que los diferencia: los léxicos tienen una vida determinada, mientras que las bases de datos terminológicas, no..., pues se están alimentando constantemente (es similar al traductor/intérprete: nunca deja de aprender ni de adquirir nuevos conocimientos).

Captura del programa Déjà Vu en el que se muestra el

momento en el que se añade un par de términos a la base

de datos terminológica.

En esta captura de pantalla de Déjà Vu podemos ver que, además, en las bases de datos terminológicas puede añadirse más información (idiomas y variantes, área a la que pertenece el término e incluso pueden especificarse los clientes; todo esto es de gran utilidad para el traductor). Asimismo, dado que la opción de «autobúsqueda» está activada, el programa muestra, de forma automática, la traducción de determinados términos que tiene almacenados en la base de datos terminológica.

¿Herramientas de gestión terminológica? ¿Memorias de traducción?...

Aunque esto quizá resulte obvio, no es lo mismo una herramienta de gestión terminológica que una memoria de traducción: mientras que la primera, como base de datos terminológica que es, solo contiene una lista de términos, la memoria de traducción tiene almacenados segmentos de textos, esto es, unidades de traducción (de los segmentos también hablé en esta entrada, a propósito de la alineación de textos), también en pares (original y traducción).

¿Cómo es la gestión terminológica en Déjà Vu y en OmegaT?

Tras la teoría viene la práctica y por ello tuvimos que aplicarlo a un ejercicio mediante Déjà Vu, en el que había que preparar un léxico mediante la memoria de traducción. Es en la práctica donde podemos apreciar las diferencias que existen entre los distintos programas de memorias de traducción.

Como ya he dicho, los sistemas de memorias de traducción tienen sus propios gestores de terminología: por ejemplo, tenemos el ya conocido Déjà Vu y el también conocido OmegaT; como es lógico, la interfaz de Déjà Vu hace que la creación de una terminología sea algo más sencillo que en el caso de OmegaT, pero no hay existen tantas diferencias (en definitiva, se trata de las diferencias que existen entre un programa de pago y uno gratuito). Además, Déjà Vu ofrece la posibilidad de especificar el cliente o el ámbito al que pertenece dicha terminología, entre otros aspectos, para así tener la información perfectamente etiquetada, tal y como ocurre con la memoria de traducción (sobre la creación de una memoria de traducción y, en concreto, sobre este aspecto, ya hablé en esta entrada).

Veamos el caso concreto de estos dos programas. Crear un lexicón en Déjà Vu a partir de una memoria de traducción es muy similar a como se hace en Lexterm, por lo que resulta muy sencillo: solo hay que seleccionar las preferencias y aceptar, y ya estará creado el lexicón:

Captura de pantalla de Déjà Vu que muestra la ventana en la que se eligen
las preferencias a la hora de crear un lexicón.

Sin embargo, de la lista que ofrece el programa, el traductor deberá seleccionar aquellas palabras que considere términos (el programa ofrece, además, la posibilidad de ver las palabras en su contexto; esto ayuda al traductor a decidir si son términos o no) y que, como tales, deban incluirse en el lexicón:

Captura de pantalla del programa Déjà Vu. Es ahora cuando el traductor
debe seleccionar solo aquellos términos que vayan a serle útiles en la

traducción y que se incluirán en el lexicón.

Además, una vez que se tenga hecho, Déjà Vu ofrece la posibilidad de exportar el léxico a un formato externo legible (por ejemplo, para que el cliente lo vea y lo apruebe). Y si el traductor, cuando ya ha empezado a traducir, ve necesario incorporar términos nuevos, también puede hacerlo (mediante las herramientas situadas en la parte superior de la interfaz del programa o mediante combinaciones de teclas):

En Déjà Vu, añadir un par de términos a la base de datos

terminológica o al lexicón es tan fácil como seleccionar el

término (original y traducción) y pulsar el botón «añadir par

a lexicón» (o «añadir a terminología»).

Sin embargo, OmegaT es algo diferente, puesto que el glosario es un documento aparte que debe crearse en un editor de textos y guardarse en la carpeta Glossary (OmegaT distribuye cada componente del proyecto en carpetas diferentes). Aun así, a grandes rasgos, la forma de proceder en ambos programas es muy similar (por lo que el dominio de las funciones básicas de todo programa de memorias de traducción permite poder utilizar sin dificultad cualquier programa de este tipo).

Entonces, ¿por qué es importante la terminología?

Ahora bien, ¿por qué es de gran importancia disponer de una buena base de datos terminológica? No es solo para que el traductor pueda traducir de forma correcta y eficaz determinados términos, sino que también es importante porque, dado que el lexicón se construye antes de empezar a traducir, el traductor puede solucionar la traducción de las palabras básicas del texto, es decir, extraer palabras clave, lo que le permite familiarizarse con el ámbito del texto que está traduciendo (muchas veces hay que traducir textos cuya área de especialización no conocemos demasiado), pues con estas palabras clave accede a los núcleos de la información del tema en cuestión.

Además, garantiza la coherencia interna de la traducción, no solo en los casos en los que se trabaje en equipo, sino también cuando el traductor esté trabajando solo. Una vez que esté traduciendo, el programa realizará autobúsquedas (en el caso de Déjà Vu, por ejemplo), es decir, buscará si hay algo aprovechable en dichas bases de datos y avisará al traductor en el caso de que algún término del texto original se encuentre ya almacenado en la base de datos terminológica con su correspondiente traducción, por lo que el traductor solo tendrá que utilizar una combinación de teclas (también en el caso de Déjà Vu, Ctrl más el número del término, que aparece indicado en la ventana de autobúsqueda, como puede verse en la parte inferior derecha de la imagen anterior).

La principal crítica que se hace a las memorias de traducción es que, si no cuentan con una gran cantidad de material almacenado, no sirven... Sin embargo, esto no es así, dado que también son útiles cuando hay que conservar el formato (como en el caso de la traducción de una página web), por ejemplo, y, además, conforme se vaya traduciendo puede ir añadiéndose material, desde memorias de traducción hasta lexicones que, más tarde, se incorporarán a la base de datos terminológica, dando lugar a una memoria de traducción muy bien alimentada y a una traducción de mejor calidad:

Resultado final del ejercicio realizado hoy en clase que

consistía en la traducción del manual de un iPad; en este

caso, por ejemplo, disponer de un buen lexicón o de una

buena base de datos terminológica es fundamental para

conseguir una mejor traducción en cuanto al tiempo

empleado en realizarla y en cuanto a su calidad.

__________________________

(1) Una definición más completa es la que ofrece SDL/Trados en su página web: http://www.translationzone.com/en/translation-agency-solutions/terminology-management/ [Consulta: 20/IV/2012]

miércoles, 18 de abril de 2012

Traducir mediante una memoria de traducción: funciones y herramientas básicas

Funciones comunes a todos los programas de memorias de traducción

Estas últimas clases de Informática las hemos dedicado a seguir trabajando con las memorias de traducción. Como ya he dicho en varias ocasiones (Memorias de traducción: ¿amigo o enemigo?), las memorias de traducción son una herramienta fundamental para el traductor, puesto que le permiten ser más eficiente, además de que le aseguran una coherencia interna en el texto (es decir, que no traducirá un mismo término de formas distintas) y también le aseguran que no cometerá errores de léxico en su traducción. A pesar de que es mejor que dichas memorias cuenten con material previamente almacenado, el traductor también puede trabajar con ellas aunque no tenga nada almacenado (e, incluso, puede ir almacenando lo que desee conforme vaya traduciendo, lo cual sería muy beneficioso para él).

Captura de pantalla del programa de memoria de
traducción Déjà Vu.

Existen distintos tipos de programas de memorias de traducción: los hay de pago y los hay de código abierto; del primer tipo, tenemos Déjà Vu, que es el que estamos utilizando en clase; del segundo tipo, un ejemplo sería OmegaT (que también lo hemos visto en clase); grosso modo, todos estos programas son muy parecidos.

Ahora bien, volviendo al tema que nos ocupa, las memorias de traducción (independientemente del programa que se esté utilizando y de cuánto haya que haber pagado para ello) tienen unas funciones básicas comunes, por lo que si se sabe manejar uno, podrá utilizarse cualquier otro sin problemas.

Captura de pantalla del programa de memoria de traducción

OmegaT. Las funciones y herramientas son, en esencia,

iguales que las de Déjà Vu, y en lo que difieren es en la

interfaz, que es más atractiva en el caso de Déjà Vu.

Como se dijo al principio de este tema y como hemos consolidado hoy en clase con un ejemplo práctico, en todo software de memoria de traducción son necesarios tres componentes: un proyecto, una memoria de traducción y una base de datos terminológica (independientemente del material que contengan). Así, a medida que se vayan traduciendo los distintos segmentos (ya mencioné aquí cómo el programa de memoria de traducción divide el texto en segmentos), el programa los irá incorporando a la memoria de traducción (de forma automática o a voluntad del traductor). A este respecto, el asistente de Déjà Vu es bastante simple, pues te ayuda mediante un asistente para crear un proyecto, una memoria de traducción o una base de datos terminológica, por ejemplo.

La terminología también es fundamental para la traducción, pues una buena base de datos terminológica (o un léxico, si se trata de una base de datos creada específicamente para un proyecto de traducción determinado que luego podría incorporarse a la base de datos terminológica) también le asegura al traductor que sus traducción va a ser coherente y va a ser de mayor calidad, especialmente, cuando se trate de textos especializados, donde las memorias de traducción son más productivas. El programa también puede avisar al traductor (en Déjà Vu, se puede comprobar mediante la opción de "check terminology") de que no ha traducido el término como debería (es decir, como la traducción de dicho término que tiene almacenada en la base de datos terminológica), por lo que reduce de forma drástica los despistes... lo que nos resultaría muy útil a muchos. De todas formas, procuraré ampliar este tema en otra entrada.

Déjà Vu, como decía, tiene una serie de funciones básicas. Me gustaría comentarlas, aunque sea brevemente, para que veáis que se trata de un programa muy útil para el traductor (pero insisto en que los programas de código abierto(1) como OmegaT pueden utilizarse perfectamente y con ellos puede conseguirse el mismo resultado que con Déjà Vu).

Así, algunas de estas funciones, tal y como pudimos ver en clase, son un contador de palabras (muy útil, por ejemplo, a la hora de realizar la factura y de cobrar al cliente) o un análisis bastante exhaustivo (que puede enviarse a la empresa o al cliente que hayan contratado los servicios del traductor), que ofrece un resumen de lo que está realizando el traductor, así como dónde se encuentra la memoria, cuántos proyectos contiene o distintos porcentajes (de similitud con la memoria, de repeticiones internas, es decir, si hay fragmentos que se repiten, por ejemplo), y que puede guardarse como información del proyecto, tal y como puede verse en esta captura de pantalla:

Captura de pantalla del programa de memoria de traducción
Déjà Vu, donde se muestra el análisis de un proyecto determinado.

Otra función de Déjà Vu consiste en que ofrece la posibilidad de configurar la segmentación (el programa segmenta por defecto, como ya dije, a partir del punto, pero esta configuración puede cambiarse).

Cómo el traductor se comunica con el programa de memorias de traducción

También es importante hablar no solo de las funciones, sino también de las herramientas o, de forma más general, de la interfaz del programa. Es fundamental que el traductor se comunique con el programa y, para ello, dispone de una serie de herramientas, situadas en una barra que se encuentra en la parte superior:

Captura de pantalla de Déjà Vu. La barra de herramientas
está señalada mediante un rectángulo en rojo.

Como podéis ver (y como ya habré mencionado en más de una ocasión), en la parte izquierda se sitúa el texto original, a su derecha, el meta (esta parte, como es lógico, está en blanco al principio, pues es el traductor el que debe “rellenarla” al traducirla) y en la parte de arriba se encuentra la barra de herramientas (que he señalado mediante un rectángulo en rojo), además del explorador y de las propiedades del proyecto, situados en la parte derecha.

Entre el texto origen y el texto meta hay otra barra (que esta vez he señalado mediante un rectángulo en verde), como podéis ver en la siguiente imagen:

Captura de pantalla de Déjà Vu. Lo referente a los códigos
está señalado en verde.

En esta barra se encuentra una serie de códigos que, a su vez, contienen información, por lo que es muy recomendable no eliminarlos si no se sabe qué es exactamente lo que se está suprimiendo. Recordemos que la memoria de traducción mantiene todo el formato del texto origen, aunque no lo muestre mientras el traductor está traduciendo: una vez que finalice el proyecto y lo guarde, el programa, automáticamente, volverá a incorporar toda la información del texto origen, consiguiendo un texto meta exactamente igual al texto origen en cuanto al formato; esto es especialmente útil cuando se traducen, por ejemplo, páginas webs.

Cuando hay algo que falla, el programa avisa mediante un aspa roja; lo mejor es que el traductor copie el formato de todos los segmentos del texto origen (en Déjà Vu existe una opción para hacerlo de forma automática) en los segmentos meta y se limite a traducir el texto; hay que procurar tener una actitud de “no tocar nada” para no terminar estropeándolo todo… También es más que recomendable ir incorporando cada segmento a la memoria, de forma que, si estos segmentos vuelven a aparecer, el programa los traducirá de forma automática (si el usuario ha activado la casilla de “autopropagación”(2) en las opciones); también la incorporación a la memoria se puede hacer de forma automática.

Esto es lo básico que debe saber un traductor a la hora de utilizar un programa de memoria de traducción, independientemente de cuál sea, pues es conveniente que tenga varias referencias para poder elegir el programa más adecuado para poder traducir adaptándose a la situación o al cliente: por ejemplo, el programa de código abierto OmegaT podría utilizarse al trabajar por primera vez con un cliente que no pida un formato de memoria de traducción determinado. De hecho, los programas de código abierto son una opción muy recomendable (a no ser que los clientes exijan un programa específico), dado que permiten al traductor que se habitúe a este tipo de programas (si está empezando, por ejemplo) sin haber tenido que pagar para poder utilizarlos. Además, los programas de código abierto siguen evolucionando, ya que cuentan con un equipo de desarrolladores que lo van mejorando (aunque es verdad que las herramientas gratuitas no incluyen una interfaz tan “atractiva” como otros programas de pago, pero es cuestión de acostumbrarse).

Como conclusión, es fundamental tener unas nociones básicas sobre programas de memorias de traducción, dado que, de esta forma, podrá manejarse cualquier programa de este estilo, desde Déjà Vu hasta OmegaT, aunque es verdad que unos siempre serán mejores que otros.

Actualizado (24/IV/2012): Os ofrezco tres análisis muy interesantes a propósito de las nuevas funciones de Déjà Vu X2. En esta entrada se habla sobre el deep mining, esto es, que el programa de memoria de traducción realiza un cruce de segmentos: deduce la traducción de un segmento determinado a partir de la traducción de distintos segmentos. Asimismo, en esta otra entrada, un artículo publicado en La linterna del traductor, se habla de las novedades de la versión de 2011 del programa SDL Trados Studio. Por último, en esta entrada se ofrece un resumen de las características más significativas de OmegaT, SDL Trados Studio, Déjà Vu y memoQ.

____________________________________

(1)A propósito de los programas de código abierto para traductores, he incluido, en la lista de blogs de traducción, dos blogs de gran utilidad para traductores, dado que ofrecen un gran número de programas de código abierto para traductores: Software para traductores y Traducción y mundo libre. De esta forma, no pretendo hablar de los programas de código abierto en general, por lo que solo los analizaré (y, de hecho, ya lo he hecho en alguna ocasión) a propósito de la teoría con la que estén relacionados.

(2)El programa compara de forma automática el texto origen con las traducciones que contiene en su memoria de traducción, de forma que puede haber coincidencias totales, donde se efectuaría la (auto)propagación, o coincidencias parciales, conocidas como fuzzy matches. De hecho, incluso si no hay coincidencias totales, el programa muestra la traducción del segmento que sí ha reconocido y, a continuación, deja el resto del segmento en inglés, para que sea el traductor el que lo complete.

miércoles, 4 de abril de 2012

La traducción automática

Creo que ha llegado el momento de hablar un poco sobre la modalidad de traducción que amenaza con quitarnos el trabajo...

A pesar de que no pretendo ser fatalista, sí que es verdad que la traducción automática mejora a pasos agigantados y, por ello, en cierto modo representa una amenaza para los traductores humanos. Sin embargo, todavía no es momento de alarmarse, como he demostrado en algunas entradas y como demostré en dos trabajos que realicé para la asignatura de (precisamente) Traducción Automática el año pasado.

El traductor automático está muy lejos de sustituir al traductor humano, aunque cada vez lo hace mejor y un buen ejemplo de esto es el traductor de Google que, debido a que ha sabido aprovecharse del creciente fenómeno del crowd-sourcing (o podríamos decir que ha obtenido una gran ventaja gracias a la enorme y desinteresada aportación de muchas personas que se ofrecen para corregir las traducciones automáticas), está alcanzando una calidad sorprendente... Gracias a esto, Google va a volver a consolidarse como gigante, parece ser.

Volviendo al tema que nos ocupa, como ya he dicho, me gustaría hablar brevemente sobre la traducción automática. ¿En qué consiste? ¿Por qué es tan importante? ¿Tiene que ver con los temas de los que he estado hablando desde que empecé a escribir el blog? ¿Debemos sentirnos amenazados por la traducción automática? Me voy a tomar la licencia de utilizar los trabajos que presenté para la asignatura de Traducción Automática (que para eso son míos...); sin embargo, como no están publicados en ningún sitio (es lo que tiene carecer de prestigio en el mundillo), tendréis que fiaros de lo que os cuento.

¿En qué consiste la traducción automática?

La traducción automática se incluye dentro de la disciplina de la Lingüística Computacional que, a su vez, se incluye en el Procesamiento del Lenguaje Natural (que se engloba dentro de la Inteligencia Artificial). El proceso no tiene mayor misterio (¡en teoría!): se le ofrece un texto en una lengua al programa y este lo traduce, siempre que la lengua de origen o de llegada se incluya entre sus «lenguas de trabajo», claro.

Ahora bien, los resultados de este tipo de programas dejan mucho que desear y por ello es bien conocido Google Translate (de él hablé, por ejemplo, a propósito de la posedición en las traducciones automáticas); sin embargo, sus resultados son cada vez mejores...

Sin embargo, también existen programas más específicos de traducción automática; en mi caso, analicé para esos trabajos el programa Systran, que combina dos tipos de traducción automática, la directa (es decir, palabra por palabra; el programa utiliza un conocimiento más de tipo morfológico) y la de transferencia (el programa utiliza un conocimiento lingüístico comparativo entre las dos lenguas, la origen y la meta y, a partir de este, realiza un análisis sintáctico mediante árbol); no utiliza, sin embargo, la de interlingua, en la que lo importante es la idea, el significado (en este tipo de traducción automática, se traduce el texto origen a lo que significa y, a partir de ese significado, genera el texto meta). Como veis, he aprovechado este párrafo para incluir algunos conocimientos básicos sobre la traducción automática...

Captura de pantalla del programa Systran. Extraído de

http://www.translationsoftware4u.com/systran-standard.php

Las conclusiones que saqué de este programa fueron que, en definitiva, las calidades de las traducciones hechas por programas de traducción automática son aceptables, pero... podrían mejorarse muchísimo, no solo desde el punto de vista estilístico (el más complicado de todos para cualquier programa informático), sino también desde los otros puntos de vista (léxico, morfológico, sintáctico...).

A propósito de los resultados de las traducciones automáticas, me gustaría añadir el concepto de tradautomaticidad, que sería, a grandes rasgos, la «aparición en un texto de rasgos lingüísticos que indican al receptor que es una traducción y que no ha sido realizada por un ser humano»(1); ¿cuántas veces hemos dicho que una determinada traducción parece haber sido hecha por el traductor de Google, de lo mala que es? Pues ahí está esa tradautomaticidad...

Para intentar solucionar los problemas de la traducción automática (y, en concreto, para intentar mejorar sus resultados), centré el segundo trabajo de dicha asignatura en el problema de las multipalabras, combinaciones léxicas de una o más palabras que suelen dar bastantes quebraderos de cabeza al traductor automático, puesto que, muchas veces, lo peor que puede hacerse es traducirlas literalmente, es decir, palabra por palabra. Recuerdo que en el trabajo ponía el ejemplo, entre otros, de la traducción al inglés de Pedirle peras al olmo, To get blood out of a stone... Nada que ver, como veréis.

¿Qué debe hacer el programa de traducción automática en estos casos? Pero ¿es acaso consciente de que se tratan de multipalabras? En la mayoría de los casos, no, por lo que las traduce de forma automática y problema solucionado. No quiero entretenerme con los análisis que realicé (ni tampoco os recomiendo que leáis el trabajo, porque, primero, es bastante extenso y, segundo y sobre todo, no está publicado, repito, en ninguna parte), pero sí que es verdad que, al echar la vista atrás, me he sorprendido de todas las propuestas de las que hablé en su momento, incluido un análisis tomando como punto de partida la lengua japonesa y las ambigüedades a las que se enfrenta el traductor automático... (Si, en ocasiones, nosotros mismos no sabemos qué quiere decir el autor del original, ¿cómo va a saberlo el traductor automático?)

¿Por qué es tan importante la traducción automática?

Creo que, después de todo lo que he dicho, poco más se puede añadir... Sí que es verdad que los programas de traducción automática nos ayudan cada vez más en la traducción de textos aunque, como con todo, hay que tener cuidado y no depender totalmente de ellos, y que solo sirvan de ayuda (por cierto, se trata de la misma conclusión a la que llegué a propósito de las memorias de traducción), es decir, que sean una herramienta más para el traductor, para ayudarle a ser más eficaz y a que la calidad de sus traducciones sea mucho mejor. En definitiva, más que la traducción automática, sería mejor utilizar las memorias de traducción, pero no me detendré más en esa parte.

De todas formas, la traducción automática resulta muy útil a la hora de traducir textos repetitivos o sencillos, es decir, más objetivos, como podrían ser los textos especializados (y nada de usarla, por supuesto, para la traducción literaria...). También sirve como una primera aproximación a un texto, conozcamos o no la lengua de origen (y si no la conocemos, resulta muy útil).

Y... ¿esto tiene que ver con las entradas anteriores?

Creo que, a estas alturas (del blog y de la entrada, me refiero), no hay mucho más que añadir... Y la pregunta se responde por sí sola: sí, todo esto tiene que ver con la informática aplicada a la traducción, dado que, a la larga, todas estas utilidades, programas, herramientas, aplicaciones, consejos, comentarios, reflexiones... sirven para que nuestro trabajo mejore y para que sea más rápido... y para poder sobrevivir en el actual mercado laboral, claro, en el que te exigen saber de casi todo (por no decir de todo).

¿Debemos sentirnos amenazados por la traducción automática?

Tampoco me queda mucho que comentar con respecto a esto: no, todavía no supone una amenaza, aunque habrá que volver a hacerse esta pregunta dentro de unos diez años (o menos, dado el ritmo al que va todo). No es una amenaza, sino que es una ayuda, no es un enemigo, sino que, como ya dije en su momento a propósito de las memorias de traducción, puede convertirse en un compañero de viaje.

Para terminar, y a modo de conclusión, os dejo una cita de Cristóbal Cáceres Rodríguez que, a mi parecer, resume bastante bien el estado de la cuestión de la traducción automática:

Los traductores automáticos, en suma, se encuentran aún muy lejos de sustituir al traductor humano. Quizás se deberían llamar más que traductores, con propiedad, gestores de léxico o algo por el estilo, porque el producto final que nos ofrecen está muy lejos de lo que se entiende, en su teoría, por una traducción. Sin duda, son un buen auxiliar que resuelve situaciones de escasa importancia o agilizan el trabajo de comprensión ante un texto de otra lengua. Sin embargo, a las limitaciones inherentes a todo diccionario, que son su punto de partida, hay que añadir las de poseer una mayor o menor capacidad de almacenaje y gestión de la información y la de tenerse que mover siempre en los límites de lo inventariable y computable; son, en suma, incapaces de interpretar, de comprender y esto es particularmente perceptible en aquellos usos del lenguaje en los que predominan valores de individualización; el lenguaje poético, en el que predomina la función estética, puede ser un buen ejemplo [...]; el uso consciente de valores connotativos hace prácticamente imposible la traducción automática de un poema.(2)

____________________________
(1)Moré López, Joaquim, Climent Roca, Salvador: «La tradautomaticidad, un concepto aplicado a la evaluación de sistemas de traducción automática» en Procesamiento del lenguaje natural, n.º 37, 2006, p. 234.
(2)Cáceres Rodríguez, Cristóbal : «Connotaciones y traducción automática» en Cien años de investigación semántica, de Michel Breal a la actualidad: actas del congreso Internacional de Semántica, vol. 2, 2000, p. 1275.

lunes, 2 de abril de 2012

La extracción de términos

Cómo realizar de forma casi automática la extracción de términos para así crear un glosario ad hoc

El otro día en clase comenzamos un tema nuevo a propósito de la extracción terminológica. Como sabréis, la extracción terminológica consiste, grosso modo, en seleccionar de varios textos especializados de un tema concreto aquellas palabras que puedan considerarse términos (es decir, palabras especializadas de un ámbito determinado) y que, por lo tanto, deban incluirse en un glosario.

La elaboración de un glosario resulta fundamental, como hemos ido aprendiendo a lo largo de la carrera. Estos glosarios nunca terminan de crearse (en mi glosario de traducción económica, por ejemplo, tengo incluidos más de mil trescientos términos y este glosario crece día a día) y son muy útiles para el traductor, que se ahorra tener que volver a buscar un término cuya traducción ya había encontrado en diccionarios o en internet, pero que no recordaba.

Sin embargo, disponer de glosarios no es solo útil para la traducción de textos que pertenecen a un determinado ámbito, sino que también es importante disponer de glosarios creados especialmente para el texto que se va a traducir (lo que se conoce como glosario ad hoc, tal y como aprendimos el año pasado en la asignatura de Terminología). De esta forma, cuando se trate de proyectos grandes en cuanto al número de palabras del texto o en cuanto al número de personas (en concreto, traductores) que trabajen en él, crear un glosario es imprescindible, puesto que:

Resulta muy útil para la traducción en general (ahorra al traductor tener que buscar la traducción de los términos en distintas fuentes).

Crea coherencia interna en el texto, de forma que, aunque participen varios traductores en el proyecto, todos traducirán de la misma forma los términos que estén incluidos en el glosario lo que, a su vez, evitará al corrector el proceso de corregir el texto con la finalidad de conseguir dicha coherencia.

Aunque se emplea tiempo en hacer estos glosarios, este tiempo es una inversión, puesto que precisamente ahorra tiempo al traductor a lo largo del proceso de traducción.

El cliente puede aprobar o comentar dicho glosario, de forma que podría cambiar algún término si lo considerara necesario, por que también se ganaría tiempo y el revisor se ahorraría una gran parte de la corrección del texto.

... Y seguro que me olvido de algún punto, puesto que las ventajas de disponer de un buen glosario son muy numerosas. Lo importante es que, por lo tanto, aunque durante el proceso de extracción terminológica dé la sensación de que se está perdiendo el tiempo, la verdad es que sí se ahorra mucho tiempo y, como he dicho en varias ocasiones, ahorrar tiempo y ser lo más eficaz posible son dos aspectos fundamentales en el traductor.

En cuanto a la aplicación práctica de esta teoría, en clase vimos el programa Lexterm, una herramienta de código abierto que permite la extracción terminológica (aunque hay que tener en cuenta que muchos programas de memorias de traducción tienen incluidos este tipo de programas como una prestación más).

Hay que tener en cuenta que existen el léxico y la base de datos terminológica. El léxico está asociado a un determinado proyecto y desaparece cuando termina dicho proyecto (sirve como herramienta intermediaria para garantizar y facilitar la calidad de la traducción). Una vez terminado el proyecto, el léxico pasaría a la base de datos terminológica, el contenedor que abarcaría todas las traducciones y términos, que estarían etiquetados por tema, cliente... como he explicado en distintas entradas.

Captura de pantalla del programa de extracción terminológica

Lexterm (en este caso, los parámetros para la discriminación

de palabras no han sido muy estrictos). El programa también

permite ver las palabras en su contexto, lo que ayuda al

traductor a decidir si debe o no considerar esas palabras

como términos.

Lexterm extrae todas las palabras de un texto que considere términos aunque, en realidad, ningún programa de este tipo realiza la extracción terminológica de forma automática, puesto que es tarea del traductor discriminar, decidiendo qué palabras deben ser términos y cuáles, no. Sin embargo, sí que se puede orientar al programa; por ejemplo, se le puede indicar que no considere términos las palabras conocidas como stopwords (es decir, palabras vacías de contenido; en internet existen muchos listados de este tipo de palabras aunque, normalmente, estas listas ya vienen incluidas en el programa de extracción terminológica), que solo considere términos aquellas palabras que se repitan un determinado número de veces (especialmente útil para textos largos, aunque hay que tener en cuenta que si hay una variación, aunque mínima, en los términos, ya no los considerará como el mismo término, como en el caso de cambio de aceite y cambio del aceite, tal y como vimos en clase) o que, incluso, solo considere términos los sintagmas formados por un número determinado de palabras (por ejemplo, una, aceite, o tres, cambio de aceite, por seguir con el ejemplo, aunque aceite, en general, no sería término, claro).

Por último, una vez seleccionados los términos (a la izquierda de cada uno hay una pequeña casilla en la que puede ponerse una marca de verificación o tick), puede añadirse su traducción correspondiente (de forma manual o de forma automática, para lo que habría que importar un corpus paralelo en vez de uno monolingüe) y, a continuación, guardarlo en formato .txt, del que ya he hablado (como veréis, este formato es muy útil y sirve para una gran variedad de programas y aplicaciones). Este formato puede abrirse con el bloc de notas; en este documento aparecerá el término con su correspondiente traducción, separados por un espacio.

Antes de la pequeña conclusión, me gustaría hablar de una nueva utilidad muy relacionada con la extracción terminológica, la Manypedia (puede leerse una breve descripción de esta utilidad en una entrada del blog de la asignatura de Informática Aplicada a la Traducción), que permite comparar los distintos puntos de vista lingüísticos que ofrecen los artículos de la Wikipedia, tanto desde el punto de vista puramente lingüístico como desde el cultural, es decir, cómo distintas culturas ven determinados hechos o conceptos; además, he de decir que la Wikipedia me sirve, en muchas ocasiones, para saber cómo se traducen algunos términos (aunque siempre hay que tener cuidado con su fiabilidad, claro). La Wikipedia podría considerarse, por lo tanto, como otra pequeña herramienta (de consulta) terminológica.

Como conclusión, me gustaría decir que los programas de extracción terminológica son muy útiles, pues le ahorran al traductor mucho tiempo en el proyecto y, además, sirven para mejorar la calidad de la traducción, para homogeneizarla y para, por cierto, ahorrarle también tiempo al corrector. De hecho, si el año pasado hubiera sabido de la existencia de este tipo de programas, habría podido utilizarlos para las asignaturas de Terminología y, en mi caso concreto, me habría facilitado la tarea de crear una base de datos terminológica sobre los dispositivos termoiónicos... Lo que quiero decir con esto es que la asignatura de Informática Aplicada a la Traducción es fundamental para cualquier estudiante de traducción y, por lo tanto, debería impartirse antes (no en cuarto curso, cuando estamos con un pie fuera, como quien dice) y no debería limitarse a un cuatrimestre: seguro que, así, tendríamos mayores conocimientos informáticos para aplicarlos a la traducción y, por ello, seríamos más eficientes y eficaces en el proceso de la traducción, y nuestras traducciones serían, a la larga, mucho mejores...