Content area

Abstract

Según señala la empresa alemana DeepL, más de 100.000 empresas utilizan su herramienta de traducción automática (TA) para traducir 26 idiomas diferentes (DeepL, 2024). A su vez, el informe Nimdzi State Of Machine Translation de 2022 indica que ya para el año 2016 la herramienta Google Traductor traducía más de 147 mil millones de palabras al día (Nimdzi, 2022). Por otro lado, según la empresa estadounidense OpenAI, son más de 300 millones de personas los que cada semana utilizan su herramienta de inteligencia artificial (IA) ChatGPT, que pude usarse para realizar traducciones (TheVerge, 2024). Estas cifras, entre otras, permiten dimensionar el grado en que las nuevas tecnologías se han insertado crecientemente en el campo de la traducción, lo que a su vez ha suscitado una amplia discusión teórica y ética sobre los usos de la TA y la IA, así como ha implicado cambios sustanciales en la práctica profesional y en las dinámicas y expectativas del mercado de la traducción. Dichas tecnologías se han incorporado incluso en el ámbito académico, donde son utilizadas para traducir artículos de publicación al inglés u otros idiomas con fines de ampliar su divulgación (O’Brien et al., 2018).

En este contexto de constante desarrollo tecnológico, numerosas investigaciones analizan y comparan el desempeño de las diferentes herramientas de traducción, tanto a niveles generales como acotados según ámbito, pares de idiomas, géneros discursivos, etc. No obstante, estas comparaciones se enfrentan al siguiente problema: la traducción no solo implica abordar las diferencias entre los sistemas y normas de dos o más lenguas, sino también aquellas diferencias que se manifiestan a nivel de las tradiciones discursivas de cada lengua y ámbito (Portolés, 2002; Loureda Lamas et al., 2020). Por lo tanto, el proceso de traducción no debe restringirse únicamente a determinar qué elementos de la lengua A pueden equivaler a los de la lengua B. Es fundamental también tener en cuenta cómo las tradiciones comunicativas de dichas lenguas gestionan estos elementos en sus textos y discursos (por ejemplo, en relación con la frecuencia y la forma en que se utilizan), y evaluar si las diferencias en esa gestión se ven reflejadas en la traducción.

Esto se puede apreciar claramente en los marcadores del discurso, aquellas unidades lingüísticas invariables que “funcionan como guías de rutas inferenciales en el procesamiento del texto” (Loureda Lamas et al., 2020, p. 10), y particularmente en los marcadores de reformulación explicativos, tales como es decir, en otros términos, (dicho) de otra manera, o, por nombrar algunos del inglés, (that is) to say, namely, entre otros. Murillo Ornat (2021) indica que, al comparar corpus de estos dos idiomas, se observa un aspecto en que las tradiciones comunicativa de ambos idiomas difieren de manera importante: en español la frecuencia de uso de los marcadores de reformulación explicativos es 3,5 veces mayor que en inglés, lo que también ha sido señalado por Cuenca (2003). Dicha discrepancia sugiere que el inglés es más lineal y permite una menor cantidad de reformulaciones que el español (Murillo Ornat, 2021), lo que plantea un desafío traductológico: ¿en qué medida y con qué recursos habría de gestionarse esta discrepancia entre las tradiciones comunicativas de la lengua de partida y la de llegada?

A esta dificultad se podrían añadir otras tres, planteadas por Portolés (2002): entre un par de lenguas no necesariamente existen marcadores del discurso equivalentes; las instrucciones de procesamiento que presentan los marcadores del discurso pueden no ser equivalentes entre la lengua fuente y la de llegada; y, aun cuando existan equivalencias, el traductor o intérprete podría considerar más conveniente guiar las inferencias mediante otros recursos en lugar de los marcadores discursivos. Todo ello da cuenta de un alto grado de complejidad que, no obstante, puede pasarse por alto en la traducción de un texto, pese a que, como se ha señalado, los marcadores discursivos son elementos clave en tanto que orientan la interpretación de este.

Dicho esto, es necesario preguntarse ¿en qué medida y de qué forma DeepL (en su versión gratuita) y ChatGPT-4.0o (de ahora en adelante, GPT-4o) traducen los marcadores de reformulación explicativos? ¿Se toman consideraciones respecto a los usos y frecuencias de cada tradición comunicativa? Surge la necesidad, por tanto, de investigar los modos en que las herramientas tecnológicas abordan la traducción de los marcadores de reformulación explicativos.

Con el fin de acotar el alcance del estudio y de circunscribir la investigación a una tradición comunicativa específica, se delimitará el ámbito discursivo al académico, en particular, al del artículo de publicación de las humanidades. En esa línea, el corpus analizado en esta investigación se ha extraído de la revista Anales de la Literatura Chilena, publicada semestralmente por la Pontificia Universidad Católica de Chile.

1.2 Objetivo general, objetivos específicos y preguntas de investigación

1.2.1 Objetivo general

El objetivo general que guía esta investigación es describir en qué medida y cómo GPT4o y DeepL traducen del español al inglés los marcadores de reformulación explicativos en artículos académicos del ámbito de las humanidades.

1.2.2 Objetivos específicos

En función de este objetivo general, se han planteado los siguientes objetivos específicos:

1. Compilar un corpus de artículos académicos en español de la revista Anales de Literatura Chilena.

2. Detectar en el corpus los marcadores de reformulación explicativos según la propuesta de Murillo Ornat.

3. Extraer los fragmentos a ser traducidos mediante GPT-4o y DeepL.

4. Identificar las soluciones de traducción utilizadas en cada traducción.

5. Analizar los resultados y detectar las tendencias o enfoques de traducción subyacentes.

6. Realizar un análisis comparativo entre ambas herramientas tecnológicas.

1.2.3 Preguntas de investigación

Conforme a estos objetivos, la investigación se guiará por las siguientes preguntas de investigación:

• ¿Cuáles son las principales soluciones que utilizan GPT-4o y DeepL en la traducción del español al inglés de los marcadores de reformulación explicativos en el ámbito de las humanidades?

• En relación con los marcadores de reformulación, ¿reflejan las herramientas tecnológicas las diferencias en las tradiciones comunicativas que existen entre el discurso académico de cada lengua?

Sumado a lo anterior, debido a que GPT-4o es altamente sensible a los prompts (instrucciones que ingresa el usuario al interactuar con la herramienta), se deriva una tercera pregunta a considerar:

• ¿Se observan variaciones significativas en las soluciones empleadas por GPT-4o en función del prompt que se le proporcione?

1.3 Justificación del interés y contribución del proyecto

El auge de la inteligencia artificial y de los sistemas de traducción automática basados en redes neuronales ha transformado de manera radical el campo de la traducción y ha captado el interés de la investigación académica. No obstante, la velocidad con la que surgen nuevas tecnologías representa un desafío importante: es fundamental llevar a cabo investigaciones continuas para mantener un conocimiento y un análisis crítico actualizados. Un ejemplo de esta dinámica es el lanzamiento de ChatGPT-4o en marzo de 2024, un modelo basado en la arquitectura GPT-4o y que actualiza el modelo ChatGPT-4 de marzo de 2023 —que a su vez actualizaba la versión ChatGPT 3.5 de noviembre de 2022— y que amerita ser estudiado en sus particularidades.

Cabe añadir que un gran número de las investigaciones sobre ChatGPT y DeepL provienen de las ciencias de la computación o de otras áreas de la lingüística, por lo que son escasos los estudios de enfoque traductológico, y son aún más escasos aquellos que centran su análisis en la traducción del español al inglés, el ámbito de las humanidades y los marcadores discursivos. En esa línea, este proyecto de investigación busca contribuir a cerrar la brecha entre el avance tecnológico y la evaluación académica de estas herramientas, además de arrojar luz sobre la traducción de los marcadores de reformulación en la dirección español-inglés.

Junto a lo anterior, la presente investigación pretende profundizar en la comprensión de las limitaciones y posibilidades traductológicas que ofrecen GPT-4o y DeepL, promoviendo así un uso responsable y la optimización de su eficacia. Se espera que los hallazgos de este estudio contribuyan a futuras investigaciones sobre la traducción del español al inglés mediante GPT-4o y DeepL, especialmente del ámbito académico de las humanidades y respecto de los marcadores del discurso.

1.4 Perspectiva teórica

Para la comprensión de la inteligencia artificial y la traducción automática, esta investigación se basa en las definiciones y aportes de Alawida et al. (2023) y Brown et al. (2020) para GPT4o y de Vaswani et al. (2017) y Kamaluddin et al. (2024) para DeepL.

La perspectiva general de los marcadores del discurso y la noción de tradiciones comunicativas proviene de los aportes de Loureda Lamas et al. (2020). En cuanto a los marcadores de reformulación explicativos, se abordarán desde los trabajos de Murillo Ornat (2004, 2009, 2016 y 2021), quien a su vez recoge las propuestas de Portolés (1996) y se basa en el enfoque instruccional propuesto por dicho autor (2001), así como en la teoría de la Relevancia (Sperber y Wilson, 1995; Blackmore, 1987) y la teoría de la argumentación (Ducrot, 1984).

Abstract (AI English translation)

Information popover about translation disclaimer

According to the German company DeepL, more than 100,000 companies use its automatic translation (MT) tool to translate 26 different languages ​​(DeepL, 2024). In turn, the 2022 Nimdzi State Of Machine Translation report indicates that by 2016 the Google Translate tool was translating more than 147 billion words a day (Nimdzi, 2022). On the other hand, according to the American company OpenAI, more than 300 million people use its artificial intelligence (AI) tool ChatGPT every week, which can be used to perform translations (TheVerge, 2024). These figures, among others, allow us to gauge the degree to which new technologies have increasingly been inserted in the field of translation, which in turn has sparked a broad theoretical and ethical discussion on the uses of MT and AI, as well as has implied substantial changes in professional practice and in the dynamics and expectations of the translation market. These technologies have even been incorporated into the academic field, where they are used to translate publication articles into English or other languages ​​in order to expand their dissemination (O'Brien et al., 2018).

In this context of constant technological development, numerous investigations analyze and compare the performance of different translation tools, both at general levels and limited by field, language pairs, discursive genres, etc. However, these comparisons face the following problem: translation not only involves addressing the differences between the systems and norms of two or more languages, but also those differences that manifest themselves at the level of the discursive traditions of each language and area (Portolés, 2002; Loureda Lamas et al., 2020). Therefore, the translation process should not be restricted solely to determining which elements of language A can be equivalent to those of language B. It is also essential to take into account how the communicative traditions of these languages ​​manage these elements in their texts and discourses (for example, in relation to the frequency and way in which they are used), and evaluate whether the differences in this management are reflected in the translation.

This can be clearly seen in discourse markers, those invariant linguistic units that “function as guides of inferential routes in text processing” (Loureda Lamas et al., 2020, p. 10), and particularly in explanatory reformulation markers, such as that is, in other terms, (said) otherwise, or, to name a few from English, (that is) to say, specifically, among others. Murillo Ornat (2021) indicates that, when comparing corpuses of these two languages, an aspect is observed in which the communicative traditions of both languages ​​differ significantly: in Spanish the frequency of use of explanatory reformulation markers is 3.5 times greater than in English, which has also been pointed out by Cuenca (2003). This discrepancy suggests that English is more linear and allows for fewer reformulations than Spanish (Murillo Ornat, 2021), which poses a translational challenge: to what extent and with what resources should this discrepancy between the communicative traditions of the source and target language be managed?

To this difficulty we could add three others, raised by Portolés (2002): between a pair of languages ​​there are not necessarily equivalent discourse markers; the processing instructions presented by discourse markers may not be equivalent between the source and target languages; and, even when equivalences exist, the translator or interpreter might consider it more convenient to guide inferences using other resources instead of discourse markers. All of this reflects a high degree of complexity that, however, can be overlooked in the translation of a text, despite the fact that, as has been pointed out, discourse markers are key elements in that they guide its interpretation.

That said, it is necessary to ask to what extent and in what way DeepL (in its free version) and ChatGPT-4.0o (hereinafter GPT-4o) translate explanatory reformulation markers? Are considerations taken regarding the uses and frequencies of each communicative tradition? The need arises, therefore, to investigate the ways in which technological tools address the translation of explanatory reformulation markers.

In order to limit the scope of the study and to limit the research to a specific communicative tradition, the discursive scope will be delimited to the academic one, in particular, to that of the humanities publication article. Along these lines, the corpus analyzed in this research has been extracted from the magazine Anales de la Literatura Chilena, published biannually by the Pontificia Universidad Católica de Chile.

1.2 General objective, specific objectives and research questions

1.2.1 General objective

The general objective that guides this research is to describe to what extent and how GPT4o and DeepL translate explanatory reformulation markers from Spanish to English in academic articles in the field of humanities.

1.2.2 Specific objectives

Based on this general objective, the following specific objectives have been proposed:

1. Compile a corpus of academic articles in Spanish from the magazine Anales de Literatura Chilena.

2. Detect explanatory reformulation markers in the corpus according to Murillo Ornat's proposal.

3. Extract the fragments to be translated using GPT-4o and DeepL.

4. Identify the translation solutions used in each translation.

5. Analyze the results and detect underlying translation trends or approaches.

6. Carry out a comparative analysis between both technological tools.

1.2.3 Research questions

In accordance with these objectives, the research will be guided by the following research questions:

• What are the main solutions used by GPT-4o and DeepL in the translation from Spanish to English of explanatory reformulation markers in the field of humanities?

• In relation to reformulation markers, do technological tools reflect the differences in the communicative traditions that exist between the academic discourse of each language?

Added to the above, because GPT-4o is highly sensitive to prompts (instructions that the user enters when interacting with the tool), a third question arises to consider:

• Are significant variations observed in the solutions used by GPT-4o depending on the prompt provided?

1.3 Justification of interest and contribution of the project

The rise of artificial intelligence and machine translation systems based on neural networks has radically transformed the field of translation and has captured the interest of academic research. However, the speed with which new technologies emerge represents a significant challenge: ongoing research is essential to maintain up-to-date knowledge and critical analysis. An example of this dynamic is the launch of ChatGPT-4o in March 2024, a model based on the GPT-4o architecture and that updates the ChatGPT-4 model of March 2023 — which in turn updated the ChatGPT 3.5 version of November 2022 — and that deserves to be studied in its particularities.

It should be added that a large number of the research on ChatGPT and DeepL comes from computer science or other areas of linguistics, so studies with a translational approach are scarce, and those that focus their analysis on the translation from Spanish to English, the field of humanities and discourse markers are even rarer. Along these lines, this research project seeks to contribute to closing the gap between technological advancement and the academic evaluation of these tools, in addition to shedding light on the translation of reformulation markers in the Spanish-English direction.

Along with the above, this research aims to deepen the understanding of the translational limitations and possibilities offered by GPT-4o and DeepL, thus promoting responsible use and optimizing its effectiveness. The findings of this study are expected to contribute to future research on Spanish-to-English translation using GPT-4o and DeepL, especially in the academic field of the humanities and with respect to discourse markers.

1.4 Theoretical perspective

To understand artificial intelligence and machine translation, this research is based on the definitions and contributions of Alawida et al. (2023) and Brown et al. (2020) for GPT4o and by Vaswani et al. (2017) and Kamaluddin et al. (2024) for DeepL.

The general perspective of discourse markers and the notion of communicative traditions comes from the contributions of Loureda Lamas et al. (2020). As for the explanatory reformulation markers, they will be addressed from the works of Murillo Ornat (2004, 2009, 2016 and 2021), who in turn collects the proposals of Portolés (1996) and is based on the instructional approach proposed by said author (2001), as well as on the theory of Relevance (Sperber and Wilson, 1995; Blackmore, 1987) and the theory of argumentation (Ducrot, 1984).

Details

1010268
Business indexing term
Title
Traducción Automática de los Marcadores de Reformulación Explicativos: Un Estudio Comparativo de DeepL y GPT-4o en Textos Académicos de las Humanidades
Alternate title
Automatic Translation of Explanatory Reformulation Markers: A Comparative Study of DeepL and GPT-4o in Academic Texts of the Humanities
Number of pages
102
Publication year
2024
Degree date
2024
School code
1770
Source
MAI 87/6(E), Masters Abstracts International
ISBN
9798270215835
University/institution
Pontificia Universidad Catolica de Chile (Chile)
University location
Chile
Degree
M.A.
Source type
Dissertation or Thesis
Language
Spanish
Document type
Dissertation/Thesis
Dissertation/thesis number
32364644
ProQuest document ID
3283374150
Document URL
https://www.proquest.com/dissertations-theses/traducción-automática-de-los-marcadores/docview/3283374150/se-2?accountid=208611
Copyright
Database copyright ProQuest LLC; ProQuest does not claim copyright in the individual underlying works.
Database
ProQuest One Academic