Content area
Según señala la empresa alemana DeepL, más de 100.000 empresas utilizan su herramienta de traducción automática (TA) para traducir 26 idiomas diferentes (DeepL, 2024). A su vez, el informe Nimdzi State Of Machine Translation de 2022 indica que ya para el año 2016 la herramienta Google Traductor traducía más de 147 mil millones de palabras al día (Nimdzi, 2022). Por otro lado, según la empresa estadounidense OpenAI, son más de 300 millones de personas los que cada semana utilizan su herramienta de inteligencia artificial (IA) ChatGPT, que pude usarse para realizar traducciones (TheVerge, 2024). Estas cifras, entre otras, permiten dimensionar el grado en que las nuevas tecnologías se han insertado crecientemente en el campo de la traducción, lo que a su vez ha suscitado una amplia discusión teórica y ética sobre los usos de la TA y la IA, así como ha implicado cambios sustanciales en la práctica profesional y en las dinámicas y expectativas del mercado de la traducción. Dichas tecnologías se han incorporado incluso en el ámbito académico, donde son utilizadas para traducir artículos de publicación al inglés u otros idiomas con fines de ampliar su divulgación (O’Brien et al., 2018).
En este contexto de constante desarrollo tecnológico, numerosas investigaciones analizan y comparan el desempeño de las diferentes herramientas de traducción, tanto a niveles generales como acotados según ámbito, pares de idiomas, géneros discursivos, etc. No obstante, estas comparaciones se enfrentan al siguiente problema: la traducción no solo implica abordar las diferencias entre los sistemas y normas de dos o más lenguas, sino también aquellas diferencias que se manifiestan a nivel de las tradiciones discursivas de cada lengua y ámbito (Portolés, 2002; Loureda Lamas et al., 2020). Por lo tanto, el proceso de traducción no debe restringirse únicamente a determinar qué elementos de la lengua A pueden equivaler a los de la lengua B. Es fundamental también tener en cuenta cómo las tradiciones comunicativas de dichas lenguas gestionan estos elementos en sus textos y discursos (por ejemplo, en relación con la frecuencia y la forma en que se utilizan), y evaluar si las diferencias en esa gestión se ven reflejadas en la traducción.
Esto se puede apreciar claramente en los marcadores del discurso, aquellas unidades lingüísticas invariables que “funcionan como guías de rutas inferenciales en el procesamiento del texto” (Loureda Lamas et al., 2020, p. 10), y particularmente en los marcadores de reformulación explicativos, tales como es decir, en otros términos, (dicho) de otra manera, o, por nombrar algunos del inglés, (that is) to say, namely, entre otros. Murillo Ornat (2021) indica que, al comparar corpus de estos dos idiomas, se observa un aspecto en que las tradiciones comunicativa de ambos idiomas difieren de manera importante: en español la frecuencia de uso de los marcadores de reformulación explicativos es 3,5 veces mayor que en inglés, lo que también ha sido señalado por Cuenca (2003). Dicha discrepancia sugiere que el inglés es más lineal y permite una menor cantidad de reformulaciones que el español (Murillo Ornat, 2021), lo que plantea un desafío traductológico: ¿en qué medida y con qué recursos habría de gestionarse esta discrepancia entre las tradiciones comunicativas de la lengua de partida y la de llegada?
A esta dificultad se podrían añadir otras tres, planteadas por Portolés (2002): entre un par de lenguas no necesariamente existen marcadores del discurso equivalentes; las instrucciones de procesamiento que presentan los marcadores del discurso pueden no ser equivalentes entre la lengua fuente y la de llegada; y, aun cuando existan equivalencias, el traductor o intérprete podría considerar más conveniente guiar las inferencias mediante otros recursos en lugar de los marcadores discursivos. Todo ello da cuenta de un alto grado de complejidad que, no obstante, puede pasarse por alto en la traducción de un texto, pese a que, como se ha señalado, los marcadores discursivos son elementos clave en tanto que orientan la interpretación de este.
Dicho esto, es necesario preguntarse ¿en qué medida y de qué forma DeepL (en su versión gratuita) y ChatGPT-4.0o (de ahora en adelante, GPT-4o) traducen los marcadores de reformulación explicativos? ¿Se toman consideraciones respecto a los usos y frecuencias de cada tradición comunicativa? Surge la necesidad, por tanto, de investigar los modos en que las herramientas tecnológicas abordan la traducción de los marcadores de reformulación explicativos.
Con el fin de acotar el alcance del estudio y de circunscribir la investigación a una tradición comunicativa específica, se delimitará el ámbito discursivo al académico, en particular, al del artículo de publicación de las humanidades. En esa línea, el corpus analizado en esta investigación se ha extraído de la revista Anales de la Literatura Chilena, publicada semestralmente por la Pontificia Universidad Católica de Chile.
1.2 Objetivo general, objetivos específicos y preguntas de investigación
1.2.1 Objetivo general
El objetivo general que guía esta investigación es describir en qué medida y cómo GPT4o y DeepL traducen del español al inglés los marcadores de reformulación explicativos en artículos académicos del ámbito de las humanidades.
1.2.2 Objetivos específicos
En función de este objetivo general, se han planteado los siguientes objetivos específicos:
1. Compilar un corpus de artículos académicos en español de la revista Anales de Literatura Chilena.
2. Detectar en el corpus los marcadores de reformulación explicativos según la propuesta de Murillo Ornat.
3. Extraer los fragmentos a ser traducidos mediante GPT-4o y DeepL.
4. Identificar las soluciones de traducción utilizadas en cada traducción.
5. Analizar los resultados y detectar las tendencias o enfoques de traducción subyacentes.
6. Realizar un análisis comparativo entre ambas herramientas tecnológicas.
1.2.3 Preguntas de investigación
Conforme a estos objetivos, la investigación se guiará por las siguientes preguntas de investigación:
• ¿Cuáles son las principales soluciones que utilizan GPT-4o y DeepL en la traducción del español al inglés de los marcadores de reformulación explicativos en el ámbito de las humanidades?
• En relación con los marcadores de reformulación, ¿reflejan las herramientas tecnológicas las diferencias en las tradiciones comunicativas que existen entre el discurso académico de cada lengua?
Sumado a lo anterior, debido a que GPT-4o es altamente sensible a los prompts (instrucciones que ingresa el usuario al interactuar con la herramienta), se deriva una tercera pregunta a considerar:
• ¿Se observan variaciones significativas en las soluciones empleadas por GPT-4o en función del prompt que se le proporcione?
1.3 Justificación del interés y contribución del proyecto
El auge de la inteligencia artificial y de los sistemas de traducción automática basados en redes neuronales ha transformado de manera radical el campo de la traducción y ha captado el interés de la investigación académica. No obstante, la velocidad con la que surgen nuevas tecnologías representa un desafío importante: es fundamental llevar a cabo investigaciones continuas para mantener un conocimiento y un análisis crítico actualizados. Un ejemplo de esta dinámica es el lanzamiento de ChatGPT-4o en marzo de 2024, un modelo basado en la arquitectura GPT-4o y que actualiza el modelo ChatGPT-4 de marzo de 2023 —que a su vez actualizaba la versión ChatGPT 3.5 de noviembre de 2022— y que amerita ser estudiado en sus particularidades.
Cabe añadir que un gran número de las investigaciones sobre ChatGPT y DeepL provienen de las ciencias de la computación o de otras áreas de la lingüística, por lo que son escasos los estudios de enfoque traductológico, y son aún más escasos aquellos que centran su análisis en la traducción del español al inglés, el ámbito de las humanidades y los marcadores discursivos. En esa línea, este proyecto de investigación busca contribuir a cerrar la brecha entre el avance tecnológico y la evaluación académica de estas herramientas, además de arrojar luz sobre la traducción de los marcadores de reformulación en la dirección español-inglés.
Junto a lo anterior, la presente investigación pretende profundizar en la comprensión de las limitaciones y posibilidades traductológicas que ofrecen GPT-4o y DeepL, promoviendo así un uso responsable y la optimización de su eficacia. Se espera que los hallazgos de este estudio contribuyan a futuras investigaciones sobre la traducción del español al inglés mediante GPT-4o y DeepL, especialmente del ámbito académico de las humanidades y respecto de los marcadores del discurso.
1.4 Perspectiva teórica
Para la comprensión de la inteligencia artificial y la traducción automática, esta investigación se basa en las definiciones y aportes de Alawida et al. (2023) y Brown et al. (2020) para GPT4o y de Vaswani et al. (2017) y Kamaluddin et al. (2024) para DeepL.
La perspectiva general de los marcadores del discurso y la noción de tradiciones comunicativas proviene de los aportes de Loureda Lamas et al. (2020). En cuanto a los marcadores de reformulación explicativos, se abordarán desde los trabajos de Murillo Ornat (2004, 2009, 2016 y 2021), quien a su vez recoge las propuestas de Portolés (1996) y se basa en el enfoque instruccional propuesto por dicho autor (2001), así como en la teoría de la Relevancia (Sperber y Wilson, 1995; Blackmore, 1987) y la teoría de la argumentación (Ducrot, 1984).