Hoy en día, es imprescindible para un traductor tener ciertas nociones de html
![]() |
eres de los nuestros...: ¡Sabes
lo que es el html!
|
En esta entrada me gustaría hablar brevemente del html a propósito del formato .tmx. Si abrimos un documento txt con un programa como el bloc de notas, veremos que toda la información está codificada en algo que aparentemente no tiene sentido:
Sin embargo, sí lo tiene y me gustaría comentarlo aunque solo sea de forma breve, puesto que esto puede resultarnos muy útil.
El html es el acrónimo de HyperText Markup Language. Se trata de un lenguaje de etiquetado (toda la información se clasifica) y cada vez más personas están familiarizadas con él. Yo tuve la suerte (aunque a veces pensaba que era, más bien, la desgracia) de hacer mis pinitos con el html cuando creé por primera vez un blog en Blogger (ahora estoy reviviendo la experiencia, aunque esta vez no parto de cero, claro) y me decidí a editar yo misma las plantillas que, como supongo que sabréis, se modifican mediante html.
No pretendo ampliar la información sobre este lenguaje, sino que quiero aplicarla al documento txt de la memoria de traducción que hicimos el otro día en clase (siguiendo los pasos que detallo en esta entrada y en esta entrada); además, en el blog de la asignatura (en esta entrada) se explica de forma muy detallada en qué consiste el html y se ofrecen enlaces con contenidos sobre este lenguaje.
No pretendo ampliar la información sobre este lenguaje, sino que quiero aplicarla al documento txt de la memoria de traducción que hicimos el otro día en clase (siguiendo los pasos que detallo en esta entrada y en esta entrada); además, en el blog de la asignatura (en esta entrada) se explica de forma muy detallada en qué consiste el html y se ofrecen enlaces con contenidos sobre este lenguaje.
Volviendo al archivos txt, vamos a ver un fragmento de los documentos que alineamos para crear la memoria de traducción (he utilizado distintos colores para resaltar aquellos elementos de los que hablo):
<?xml version="1.0" encoding="ISO-8859-1"?><tmx version="1.1"><header creationtool="Bitext2tmx" creationtoolversion="0.91" segtype="sentence" o-tmf="Bitext2tmx" adminlang="en" srclang="en" datatype="PlainText" o-encoding="ISO-8859-1"></header><body><tu tuid="0" datatype="Text"><tuv xml:lang="en"><seg>00 11 209 Changing engine oil, replacing oil filter element</seg></tuv><tuv xml:lang="es"><seg>00 11 209 Cambiar el aceite para el motor, cambiar el filtro de aceite</seg></tuv></tu>
Aquí podemos ver la etiqueta <header>, con su correspondiente </header> (la barra indica cierre; ¡es fundamental no olvidarse de cerrar las etiquetas!); entre estas dos etiquetas se encuadra el contenido básico que da información al programa. A continuación viene la etiqueta más importante, <body> (se cierra más adelante, aunque aquí no se vea), puesto que en ella se encuentra el contenido de la traducción, como podéis ver.
Después aparece otra etiqueta, <tu> y </tu>, es decir, la unidad de traducción (translation unit), dentro de las que se encuentran los segmentos alineados (<seg> y </seg>). Dentro de esta etiqueta hay etiquetas anidadas, como <tuv> y </tuv>, las variantes de la unidad de traducción; habrá tantas variantes de la UT como lenguas se hayan alineado (en este caso, hay dos: inglés, <tuv xml:lang="2n">, y español, <tuv xml:lang="es">). Dentro de estas variedades de la UT podrían indicarse variantes de la lengua (como español de México o inglés de Estados Unidos, por ejemplo), por lo que es muy útil etiquetar el texto de la forma más precisa (y minuciosa) posible.
Se puede concluir que tener nociones de html (aunque sean básicas) se ha convertido en algo indispensable, puesto que te permite editar una memoria de traducción en un momento dado de forma rápida y eficaz, consiguiendo que la memoria sea más precisa o, también, en el caso de que se haya olvidado añadir algo, es una forma más sencilla y menos trabajosa de editar la memoria de traducción (abre Déjà Vu, abre la memoria, busca el segmento que quieres cambiar... ¿No es más fácil darle a Control + B para buscar y, una vez encontrado el segmento que se busca, editarlo y guardarlo en un momento?)
Estas etiquetas se van repitiendo en cada segmento (y si hay algún problema o hay que cambiar algo, se puede hacer perfectamente desde el bloc de notas, pero siempre, repito, vigilando que todas las etiquetas estén cerradas) hasta que llega el The End del documento:
Después aparece otra etiqueta, <tu> y </tu>, es decir, la unidad de traducción (translation unit), dentro de las que se encuentran los segmentos alineados (<seg> y </seg>). Dentro de esta etiqueta hay etiquetas anidadas, como <tuv> y </tuv>, las variantes de la unidad de traducción; habrá tantas variantes de la UT como lenguas se hayan alineado (en este caso, hay dos: inglés, <tuv xml:lang="2n">, y español, <tuv xml:lang="es">). Dentro de estas variedades de la UT podrían indicarse variantes de la lengua (como español de México o inglés de Estados Unidos, por ejemplo), por lo que es muy útil etiquetar el texto de la forma más precisa (y minuciosa) posible.
Se puede concluir que tener nociones de html (aunque sean básicas) se ha convertido en algo indispensable, puesto que te permite editar una memoria de traducción en un momento dado de forma rápida y eficaz, consiguiendo que la memoria sea más precisa o, también, en el caso de que se haya olvidado añadir algo, es una forma más sencilla y menos trabajosa de editar la memoria de traducción (abre Déjà Vu, abre la memoria, busca el segmento que quieres cambiar... ¿No es más fácil darle a Control + B para buscar y, una vez encontrado el segmento que se busca, editarlo y guardarlo en un momento?)
Estas etiquetas se van repitiendo en cada segmento (y si hay algún problema o hay que cambiar algo, se puede hacer perfectamente desde el bloc de notas, pero siempre, repito, vigilando que todas las etiquetas estén cerradas) hasta que llega el The End del documento:
Actualizado (2/V/2012): Para más información sobre el .tmx, recomiendo encarecidamente la lectura del artículo de López Ciruelos, Andrés: «La traducción globalizada: herramientas de intercambio y comunicación» en Panace@, vol. 10, n.º 29, junio de 2009, accesible en: http://www.medtrad.org/panacea/IndiceGeneral/n29_tribuna-Ciruelos.pdf [Consulta: 2/V/2012]</body></tmx>
0 comentarios:
Publicar un comentario
Gracias por leer esta entrada. Si tienes alguna duda o si quieres dar tu opinión, agradecería mucho que dejaras un comentario.
¡Muchas gracias!