Resumen de las funciones de una memoria de traducción ~ Mundos binarios de Babel

A raíz de un resumen de las funciones de una memoria de traducción que nos ha facilitado la profesora hoy en clase, he creído conveniente, aun a riesgo de repetirme, repasar dichas funciones. Y digo que a riesgo de repetirme porque soy consciente de que muchas de estas cuestiones ya las he comentado, por lo que, en muchos casos, me limitaré a dirigir a la entrada correspondiente para, así, tenerlo todo más ordenado (al menos, esa es mi intención) y, de paso, consolidar los contenidos (aunque ya los hemos consolidado mediante la práctica realizada en la clase de hoy).

Asimismo, para todas estas cuestiones en general, también pueden consultarse las entradas Términos claves de Informática Aplicada a la Traducción (I) y Términos claves de Informática Aplicada a la Traducción (II).

Aquí presento el esquema; intentaré completarlo de la forma más conveniente.

Prestaciones básicas de las memorias de traducción

Definición de los conceptos de MT y de herramientas de las MT

à Funcionalidades de las MT. Recomiendo la lectura de las entradas Traducir mediante una memoria de traducción: funciones y herramientas básicas y Análisis en profundidad del programa de traducción asistida Déjà Vu.

à Requisitos para el uso de una MT. Para este aspecto, recomiendo las entadas Pasos previos a la creación de una memoria de traducción (I) y Pasos previos a la creación de una memoria de traducción (II).

à Ventajas y desventajas en el uso de MT. A esto también le dediqué una entrada, Memorias de traducción: ¿amigo o enemigo?

à Formatos de archivo. Además de las entradas dedicadas a los términos claves de la asignatura, puede consultarse la entrada El formato .tmx y el lenguaje html.

Componentes
Como ya he dicho en varias ocasiones, los componentes básicos de cualquier memoria de traducción son tres: un proyecto, una memoria de traducción y una base de datos terminológica. Estos son contenedores diferentes, por lo que son independientes.

Ahora bien, también puede decirse que los componentes básicos de una memoria de traducción son los siguientes:

à Editor: podríamos decir que se trata de la parte en la que se traducen los distintos segmentos del texto original. Creo que no es necesario explicar el proceso de traducción mediante los sistemas de traducción asistida, puesto que lo he mencionado en varias ocasiones a lo largo de muchas de las entradas del blog.

à Base de datos terminológica. Además de las entradas ya citadas, pueden consultarse La extracción de términos y La importancia de la terminología en los programas de memorias de traducción.

à Memoria de traducción (propiamente dicha). Ya lo he explicado en varias ocasiones: la memoria de traducción contiene una serie de documentos alineados (los segmentos de un número indefinido de textos origen junto con sus correspondientes segmentos de los textos meta) y es muy útil para el trabajo del traductor, que puede aprovecharla mediante los programas de memorias de traducción como Déjà Vu, que es con el que más nos hemos familiarizado a lo largo de este cuatrimestre.

Creación de una MT
Para la creación de cualquier memoria de traducción, hay que seguir una serie de pasos básicos, que ya expliqué en Pasos para la creación de una memoria de traducción y en la segunda parte de la misma entrada.

De todas formas, a modo de recordatorio, algunos de los pasos básicos para la creación de una memoria de traducción son los siguientes:

à Selección de idiomas tanto del texto origen como del texto meta, pues es información que necesita el programa de traducción asistida para poder gestionar los archivos y para poder recuperarlos de forma correcta.

à Gestión de archivos. La memoria de traducción se compone de una serie de archivos, cuyas ubicación y extensiones conviene conocer (dichas extensiones pueden consultarse en Términos claves de Informática Aplicada a la Traducción).

à Configuración del usuario. Resulta muy útil la opción de poder etiquetar las memorias de traducción (por idioma, cliente o ámbito de especialización, por ejemplo) para que el programa de traducción asistida pueda recuperar la información que desee el traductor (también por idioma, por cliente o por ámbito de especialización) y que pueda sacarle provecho en cuanto a la eficiencia y a la calidad de su trabajo.

à Opciones para coincidencias parciales. De las coincidencias parciales o fuzzy matching y de sus ventajas e inconvenientes he hablado, por ejemplo, en ¿Son las fuzzy matches útiles para el traductor?

Flujo de trabajo durante la traducción con MTs: pasos y procesos
¿Qué pasos hay que seguir cuando se trabaja con un programa de memoria de traducción? ¿Qué opciones y funciones ofrecen dichos programas?

à Pseudotraducción. Esta función es la que también se denomina deep mining: el programa de traducción asistida aprovecha de forma inteligente segmentos que tienen unas coincidencias altas y sustituye los términos distintos mediante la memoria de traducción y el lexicón almacenados (es decir, deduce la traducción de un determinado segmento a partir de la traducción de varios segmentos, que utiliza de forma inteligente).
Además de las entradas sobre términos de la asignatura, ya citadas, puede consultarse la entrada Un vistazo a Déjà Vu X2, que también puede aprovecharse para realizar un breve repaso del programa de traducción asistida.

à Pretraducción. De esta y de otras funciones he hablado en Análisis en profundidad del programa de traducción asistida Déjà Vu. Sin embargo, a modo de recordatorio, la pretraducción es una traducción automática que realiza el programa; es especialmente útil para textos repetitivos y le ahorra mucho tiempo al traductor, que solo tendrá que revisar la traducción automática que resulte de este proceso.

à Trabajar con segmentos. Como ya he explicado en varias ocasiones, la memoria de traducción se alimenta de una serie de segmentos alineados (texto origen junto con su correspondiente texto meta), por lo que resulta muy útil aprovechar dicha memoria para agilizar el proceso de traducción y también para conseguir que las traducciones sean más coherentes.

à Función de propagación. También he hablado de esta función en varias ocasiones: mediante la función de propagación, el programa de traducción asistida busca segmentos iguales o similares a los ya traducidos y, tras solicitar la confirmación del usuario, los inserta en aquellos segmentos que todavía no se han traducido y que son iguales o muy similares. En pocas palabras, rellena de forma automática aquellos segmentos cuya traducción todavía no se ha escrito pero que ya se ha realizado con anterioridad, por lo que le ahorra mucho trabajo al traductor y, una vez más, le asegura la coherencia en su trabajo.

à Concordancia: como explica Cristina Márquez Arroyo, la concordancia «permite encontrar todas las unidades que incluyen una palabra o frase determinada, con solo pulsar un botón. El resultado aparece en una ventana adicional que muestra todas las traducciones existentes, con la indicación de la fecha en que fueron realizadas y el nombre del usuario que las introdujo»(1).

Integrar Bases de datos
Aun siendo consciente de que me repito, creo que es necesario volver a decir que cualquier memoria de traducción se compone de tres elementos básicos: el lexicón (o lexicon), la base de datos terminológica y la memoria de traducción propiamente dicha:

à Lexicon (o lexicón): base de datos terminológica creada ad hoc, es decir, para un proyecto determinado. Cuando finaliza dicho proyecto, el lexicón se integra en la base de datos terminológica.

à Base terminológica: base de datos que incluye una serie de términos, que están emparejados (término origen junto a su correspondiente traducción) y que también incluye, lo que es muy importante, el contexto de uso de dichos términos. Estas bases de datos pueden ser multilingües y multiámbitos, por lo que pueden ser muy beneficiosas para el trabajo del traductor.

à Memoria de traducción: como ya lo he explicado varias veces, solo diré que se compone de una serie de segmentos alineados y que puede ser de gran ayuda para el traductor.

Una vez más, recomiendo, para más información sobre estos términos, la lectura de Términos claves de Informática Aplicada a la Traducción.

Crear una memoria de traducción
Como este procedimiento es básico y ya lo he explicado en varias entradas (por ejemplo, en Pasos previos para la creación de una memoria de traducción, tanto en la primera parte como en la segunda), y como los siguientes epígrafes resumen perfectamente el proceso de creación de una memoria de traducción, no lo explicaré en profundidad:

à Durante la traducción (conforme se traduce, puede ir creándose una memoria de traducción, independientemente de si ya se dispone de alguna otra memoria de traducción o no).

à Importar una memoria externa (es muy útil la posibilidad de poder importar memorias de traducción externas al propio proyecto de traducción, puesto que el traductor va a disponer de más recursos para traducir dicho proyecto).

à Crear una alineación

Actualizar la memoria de traducción
La memoria de traducción hay que actualizarla continuamente y corregirla si es necesario, pues puede haber errores que, si no se corrigen, podrían perjudicar al traductor en su trabajo. Así, a medida que se vayan recibiendo correcciones, el traductor debe actualizar la memoria de traducción:

à Durante la traducción

à Después de traducir

à Con una MT externa

Tanto durante la traducción, como una vez finalizado el proyecto; también es muy útil utilizar para esta actualización memorias de traducción externas.

Trabajar con archivos con etiquetas
Déjà Vu, como muchos otros programas de traducción asistida, tiene la ventaja de que se pueden traducir textos de una gran diversidad de formatos, dado que el programa utiliza una serie de filtros que conservan el formato del texto original y que el traductor no ve (por lo que no le dan problemas). Una vez que haya terminado el proyecto, el programa volverá a recuperar dichos filtros, obteniéndose así un texto meta exactamente igual al texto origen en cuanto al formato.

Así, existen dos tipos de etiquetas:

à Etiquetas estructurales: se refieren a todo lo que afecta al formato externo del archivo; en Déjà Vu, por ejemplo, desaparecen, por lo que no pueden dar ningún tipo de problemas.

à Códigos incrustados: son los números que en Déjà Vu aparecen entre llaves y que hacen referencia a formatos como la negrita, la cursiva o el subrayado, como ya expliqué en su momento (en esta entrada, por ejemplo). La mayoría de los problemas que surgen al exportar el proyecto se deben a problemas con dichos códigos, por lo que el traductor debe tener cuidado con dichos códigos y no modificarlos, pues podría alterar el formato del proyecto en su conjunto.

Control de calidad

à Corrección ortográfica

à Verificación etiquetas

à Comprobación terminológica

También de este aspecto he hablado a lo largo de las entradas de este blog. El control de calidad consiste, a grandes rasgos, en comprobar el proyecto ya traducido, que debe incluir una corrección ortográfica, una corrección de estilo, una comprobación terminológica (es decir, si los términos se han traducido correctamente desde el punto de vista de la propia traducción y también desde el punto de vista del ámbito del texto o del cliente que lo ha encargado, por ejemplo) e, incluso, una comprobación del formato del texto o proyecto final, en la que debe realizarse, obligatoriamente, una verificación de las etiquetas para que no haya problemas de formato, como acabo de mencionar en el apartado anterior.

Análisis y estadística

à Objetivos de las funciones de análisis y estadística: el programa de traducción asistida Déjà Vu ofrece la posibilidad de realizar un análisis exhaustivo en cuanto a las estadísticas del proyecto. Dicho análisis ofrece datos como el trabajo que está realizando el traductor en ese proyecto, dónde se encuentra la memoria, cuántos proyectos contiene y distintos porcentajes, como de similitud con la memoria o de repeticiones internas. Asimismo, esta información puede guardarse y enviarse al cliente, si es necesario.

à Tipos de repetición (interna o externa): las repeticiones internas también se conocen como duplicados y son segmentos que aparecen más de una vez en el mismo documento; una vez que se hayan traducido por primera vez, el programa de traducción asistida, mediante la función de propagación, insertará dicha traducción en los segmentos que sean iguales. En cuanto a las repeticiones externas, estas son las coincidencias exactas que se dan entre el texto que se está traduciendo y la memoria de traducción, y se llaman repeticiones externas porque ya provienen de proyectos anteriores de traducción y, por lo tanto, están disponibles antes de comenzar a traducir.(2)

à Tipos de coincidencia (difusa o 100%): ya he hablado en muchas ocasiones sobre las coincidencias totales y las coincidencias parciales o fuzzy matches, por ejemplo, en la entrada ¿Son las fuzzy matches útiles para el traductor?

à Reglas de segmentación: las reglas de segmentación son los parámetros de los que dispone el programa de memoria de traducción (o de segmentación) para realizar la segmentación del texto. Dicha segmentación se realiza por defecto a partir del punto (es decir, un segmento finaliza en un punto y da comienzo al siguiente segmento que, a su vez, termina en el siguiente punto), aunque el usuario puede cambiarlo si lo considera necesario.
Una vez que el texto esté segmentado, se procederá a la alineación (sobre la que puede verse más información en esta entrada) y a continuación.

Alineación

à Reciclar traducciones anteriores

à Automática y manual

à Cómo unir/dividir/eliminar segmentos

à Guardar proyectos de alineación e importarlos a la memoria

Como acabo de decir, la segmentación da paso a la alineación, que se realiza a partir de traducciones ya finalizadas, puesto que consiste en alinear los segmentos del texto original junto con sus correspondientes traducciones. Esta alineación puede hacerse de forma automática (el programa, mediante las reglas de segmentación, divide de forma automática el texto origen y el meta en una serie de segmentos y los une automáticamente) o de forma manual (el traductor une cada segmento con su correspondiente traducción, partiendo desde cero o corrigiendo lo que haya hecho de forma automática el programa de alineación).

De hecho, en la alineación manual, en algunas ocasiones el traductor tendrá que modificar los segmentos, uniéndolos, dividiéndolos o incluso eliminándolos para que los segmentos origen se correspondan con los meta y para que, una vez guardados e importados a la memoria, puedan aprovecharse y supongan una ventaja para su trabajo.

Gestión de la memoria de traducción

à Compactar

à Eliminar duplicados

Finalmente, la memoria de traducción puede compactarse, es decir, pueden agruparse los datos de la memoria para que esta ocupe menos espacio (solo hay que ir a herramientas>compactar); de hecho, también pueden compactarse un proyecto o la base de datos terminológica. Asimismo, el programa ofrece la posibilidad de buscar aquellos segmentos o términos duplicados (es decir, que cuenten con traducciones distintas) y visualizarlos por separado para decidir cuál su la traducción más adecuada y para eliminar aquella que no lo sea.

Espero que, tras este resumen (que ha sido más extenso de lo que había previsto), se hayan consolidado los conceptos más importantes sobre las memorias de traducción.

______________________

(1) Márquez Arroyo, Cristina: «Herramientas de traducción automática... mito y realidad», accesible en: http://bscw.rediris.es/pub/bscw.cgi/d469719/Herramientas%20de%20traducci%C3%B3n%20autom%C3%A1tica...%20mito%20y%20realidad%20(Cristina%20M%C3%A1rquez).pdf [Consulta: 8/V/2012]

(2) Heinz Freignang, Karl: «Tipos de repetición (interna o externa) (2/8)» en eCoLoTrain, accesible en: http://ecolotrain.uni-saarland.de/index.php?id=1529&L=3 [Consulta: 8/V/2012]

2 comentarios:

entintaroja dijo...: Nada mas quiero darte las gracias. Quería enterarme un poco de este asunto de las memorias de traducción y me están sirviendo de mucho tus entradas.; 21 de octubre de 2013 a las 23:15
Laura A. E. dijo...: ¡Me alegro mucho! Es cierto que hace mucho que actualizo este blog, pero no lo hago por dejadez, sino porque no he encontrado ningún otro aspecto sobre el que hablar, porque hace tiempo que terminé la asignatura de Informática aplicada a la traducción (y la carrera, ya de paso) y porque hay muchísima información de este tipo en internet... Pero intentaré actualizarlo y agradezco mucho que te esté sirviendo.

Un saludo y gracias por comentar.; 17 de diciembre de 2013 a las 11:11

Publicar un comentario

Gracias por leer esta entrada. Si tienes alguna duda o si quieres dar tu opinión, agradecería mucho que dejaras un comentario.

¡Muchas gracias!

viernes, 11 de mayo de 2012

Resumen de las funciones de una memoria de traducción

2 comentarios:

Publicar un comentario

Buscar

Suscripción

Traduce el blog a...

Etiquetas

Entradas populares

Archivo del blog