lunes, 27 de noviembre de 2017

Herramientas para académic@s: un nuevo traductor

Hierbas en chino
En la academia es de mucha importancia saber leer (y de preferencia escribir) el inglés, la lengua franca de nuestro oficio. Sobre todo entre estudiantes es muy común el uso del traductor de Google o Facebook para poder acceder a la información cuando uno todavía no tiene suficiente capacidad. A veces también se utiliza para traducir los resumenes de tesis y otros escritos, a menudo con resultados lamentables.

Hace unos meses apareció un nuevo servicio (gratuito) de traducción automática. Se llama DeepL (de deep learning) y según ellos, tienen un sistema diferente a los demás. Pueden leerlo en su página. Funciona para varios de los idiomas principales.

Yo hice algunas pruebas, y sí parece que DeepL capta mejor el sentido de lo que uno quiere decir.

Primero les presento una prueba de una traducción del inglés al español. El original es un resumen de un artículo que acaba de salir:


Medicinal plants continue to play an important role in healthcare, both in Mexico and around the world. We investigated the relationship between various sociodemographic factors, such as age, economic activity, years of schooling, socioeconomic levels, gender, and language proficiency, and the knowledge and frequency of medicinal plant use in Santiago Camotlán, Sierra Norte of Oaxaca, with a mainly Zapotec population. In a first stage, we interviewed specialists in depth and collected and identified plants for a catalogue of the medicinal plant flora (90 species). With this catalogue, we then interviewed a sample of the general population and the specialists on knowledge and frequency of use. The relationship between the sociodemographic variables and knowledge was analyzed by multiple regression. To explore differences of knowledge within the population, we identified three groups with a two-step cluster analysis; the results were compared statistically with a Kruskal-Wallis nonparametric test and then a post hoc Dunn’s test to see if all the differences between groups were significant. Age and occupation explained 54% of the variation of knowledge. Medicinal plant knowledge in the region persists mainly because of the necessity to treat the diseases that the doctor does not cure, the culture-bound syndromes, and the most common ailments, malfunctions of the digestive system.

Aquí va la traducción de Google:

Las plantas medicinales continúan desempeñando un papel importante en la atención médica, tanto en México como en todo el mundo. Investigamos la relación entre diversos factores sociodemográficos, como la edad, la actividad económica, los años de escolaridad, los niveles socioeconómicos, el sexo y el dominio del idioma, y el conocimiento y la frecuencia del uso de plantas medicinales en Santiago Camotlán, Sierra Norte de Oaxaca, principalmente con Población zapoteca En una primera etapa, entrevistamos a especialistas en profundidad y recolectamos e identificamos plantas para un catálogo de flora de plantas medicinales (90 especies). Con este catálogo, entrevistamos a una muestra de la población general y a los especialistas en conocimiento y frecuencia de uso. La relación entre las variables sociodemográficas y el conocimiento se analizó mediante regresión múltiple. Para explorar las diferencias de conocimiento dentro de la población, identificamos tres grupos con un análisis de clúster en dos pasos; los resultados se compararon estadísticamente con una prueba no paramétrica de Kruskal-Wallis y luego una prueba de Dunn post hoc para ver si todas las diferencias entre los grupos eran significativas. La edad y la ocupación explicaron el 54% de la variación del conocimiento. El conocimiento de las plantas medicinales en la región persiste principalmente debido a la necesidad de tratar las enfermedades que el médico no cura, los síndromes ligados a la cultura y las dolencias más comunes, el mal funcionamiento del sistema digestivo.

 Y luego la de Deepl:

Las plantas medicinales siguen desempeñando un papel importante en el cuidado de la salud, tanto en México como en el resto del mundo. Investigamos la relación entre diversos factores sociodemográficos, tales como la edad, la actividad económica, los años de escolaridad, los niveles socioeconómicos, el género y la competencia lingüística, y el conocimiento y frecuencia del uso de plantas medicinales en Santiago Camotlán, Sierra Norte de Oaxaca, con una población mayoritariamente zapoteca. En una primera etapa, entrevistamos a especialistas en profundidad y recogimos e identificamos plantas para un catálogo de la flora vegetal medicinal (90 especies). Con este catálogo, se entrevistó a una muestra de la población general y a los especialistas en conocimiento y frecuencia de uso. La relación entre las variables sociodemográficas y el conocimiento fue analizada por una regresión múltiple. Para explorar las diferencias de conocimiento dentro de la población, se identificaron tres grupos con un análisis de conglomerados en dos etapas; los resultados se compararon estadísticamente con una prueba no paramétrica de Kruskal-Wallis y luego con una prueba de Dunn post hoc para ver si todas las diferencias entre los grupos eran significativas. Edad y ocupación explicaron el 54% de la variación del conocimiento. El conocimiento de las plantas medicinales en la región persiste principalmente por la necesidad de tratar las enfermedades que el médico no cura, los síndromes ligados al cultivo y las dolencias más comunes, disfunciones del aparato digestivo.
Las dos traducciones se pueden entender más o menos, aunque DeepL traduce mejor algunas partes. Por ejemplo, es mejor decir "género" y "competencia lingüística" que "sexo" y "dominio del idioma" en este contexto.  Pero algunos detalles son captados mejor por Google. Por ejemplo, DeepL dice "la flora vegetal medicinal" en vez de "flora de plantas medicinales" y confunde cultura con cultivo.

Ahora del español al inglés. Uso un párrafo de un artículo en el que actualmente estoy trabajando.

El original en español:


La distribución de biomasa (Reich 2002), o asignación de biomasa como también se le conoce, da cuenta de la ubicación de la masa seca total de la planta a un tiempo, y se mide como fracciones correspondientes a cada órgano. Estas proporciones también cambian durante el desarrollo, y en la explicación de esta variación tampoco hay consenso. Por un lado se interpreta como ajustes alométricos correspondientes al tamaño de la planta (Metabolic scaling theory; Reich 2002), por otro como ajustes para afrontar los retos que impone el ambiente en tiempo real (Optimality theory; Reich 2002) y por otro más, como ajustes para mantenerse en una suerte de “plan de desarrollo” que ha sido moldeado por los retos ambientales del pasado, durante la evolución de las especies (Ontogenetic drift; Reich 2002; Coleman et al. 1994; Evans 1972). 

La versión de Google:
The biomass distribution (Reich 2002), or biomass allocation as it is also known, accounts for the location of the total dry mass of the plant at a time, and is measured as fractions corresponding to each organ. These proportions also change during development, and in the explanation of this variation there is no consensus either. On the one hand it is interpreted as allometric adjustments corresponding to the size of the plant (Metabolic scaling theory, Reich 2002), on the other hand as adjustments to face the challenges imposed by the environment in real time (Optimality theory; Reich 2002) and for another more, as adjustments to stay in a kind of "development plan" that has been shaped by the environmental challenges of the past, during the evolution of species (Ontogenetic drift, Reich 2002, Coleman et al 1994, Evans 1972). 

La versión de DeepL:
Biomass distribution (Reich 2002), or biomass allocation as it is also known, accounts for the location of the total dry mass of the plant at one time, and is measured as fractions corresponding to each organ. These proportions also change during development, and in the explanation of this variation there is no consensus either. On the one hand, it is interpreted as allometric adjustments corresponding to the size of the plant (Metabolic scaling theory; Reich 2002), on the other hand, as adjustments to face the challenges imposed by the environment in real time (Optimality theory; Reich 2002) and on the other hand, as adjustments to maintain a kind of "development plan" that has been shaped by the environmental challenges of the past, during the evolution of species (Ontogenetic drift, Reich 2002, Coleman et al 1994, Evans 1972).
 Aquí me gusta que DeepL quita el primer "The" y es más idiomático ya que usa "maintain" en vez de "to stay in". Pero, no se da cuenta que son tres lados, no dos.

Que todavía suena poco idiomático es culpa del problema al fondo de todos estos traductores (y también de gente que escribe en idiomas que no son maternas, como yo) - simplemente hay diferentes maneras de decir las cosas en los distintos idiomas, y se estructuran las oraciones de diferentes maneras. Esto es lo que puede mejorar un profesional.



No hay comentarios:

Publicar un comentario