¡Usaste ChatGPT! Las pistas que delatan que un texto fue escrito con el chatbot de OpenAI

Tal como analizamos en ChatGPT desafía a la docencia, el creciente empleo de sistemas de inteligencia artificial generativa trajo consigo beneficios a la hora de crear contenido y, en paralelo, una serie de aspectos que generan preocupación y deben ser atendidos. Uno de los inconvenientes que ha surgido es la dificultad para distinguir fehacientemente el contenido real —creado por humanos— del sintético. El caso de los textos es particularmente acuciante.

La polémica bulle especialmente en los ámbitos académicos, en los que se registran numerosísimos casos de estudiantes que entregan trabajos íntegramente escritos por modelos como ChatGPT de OpenAI o Gemini de Google. Ocurre que esas herramientas son realmente eficaces para la redacción: el usuario anota una serie de instrucciones, y los programas revisan sus bases de datos para, en pocos segundos, crear textos extensos.

Una de las grandes habilidades de ChatGPT es la redacción de texto.
Una de las grandes habilidades de ChatGPT es la redacción de texto.Por: AP

En el contenido audiovisual, por ejemplo en imágenes y videos, la elucidación podría ser más sencilla. Por caso, algunos desarrolladores han comenzado a incluir marcas de agua para mostrar sin rodeos cuándo se trata de una creación sintética. En los escritos, la identificación encierra mayores complejidades. En este marco, ¿hay modos eficientes de identificar si un texto fue escrito por ChatGPT y afines?

Un investigador revela el secreto para delatar a los textos generados con ChatGPT

A poco del lanzamiento general de su chatbot, OpenAI lanzó una herramienta que prometía identificar los escritos creados con esa herramienta. Más tarde, se supo que ni siquiera esa solución resultó eficiente, en la mayoría de los casos. Frente a tal escenario, el discernimiento humano sigue siendo la variable fundamental.

A esa dirección apuntó un investigador especializado en ciencia de datos, Fareed Khan, que en una entrada de blog en Medium comprobó cuáles son las palabras que más usa ChatGPT en los textos que genera. Así, funcionan como pistas para buchonear a los escritos generados con el chatbot de OpenAI.

El gráfico muestra el exponencial crecimiento en el uso de la palabra "delve". (Fuente: Fareed Khan/Medium)
El gráfico muestra el exponencial crecimiento en el uso de la palabra «delve». (Fuente: Fareed Khan/Medium)

Para esto, Khan insertó en una base de datos miles de textos publicados en blogs y reunió 19.000 millones de palabras. Uno de los ejemplos que usó es el término “delve” (“ahondar” en español), que en 2010 apenas se usó y se multiplicó exponencialmente desde la aparición de ChatGPT. En tanto, aquella es una de las palabras “favoritas” del modelo GPT y una pista que delata a los escritos con ese sistema. Otros términos como “unmavering” (“inquebrantable”), “pivotal” (“esencial”) “nanscent” (“naciente”) y “intricacies” (“complejidades”) también se repiten con gran frecuencia en la actualidad.

Los interesados pueden revisar el informe de Khan, en el que se listan 100 palabras tan habituales en los discursos de ChatGPT, que podrían servir como huellas para la detección de textos sintéticos.

More from the blog

Corrupción en Chaco: La Verdad Detrás de las Promesas de Transparencia

La semana pasada, compartí con ustedes una primicia que comenzaba a destaparse en el ámbito político de Chaco: las denuncias de corrupción que sacuden...

La fiesta inolvidable para celebrar el veto a los jubilados

Los mejores looks de los diputados para el asado de los héroes que ayudaron a Milei a rechazar el aumento de 13 mil pesos.

El jefe de Franco Colapinto en la escudería Williams hizo una fuerte advertencia antes del GP de Singapur

James Vowles ya palpita lo que será la carrera de Fórmula 1 del fin de semana y alertó a hinchas y pilotos.

El Gobierno apeló el fallo que ordenó la suspensión del DNU que habilita las Sociedades Anónimas Deportivas

El Juzgado Federal de Mercedes había ordenado al Estado Nacional la suspensión de los efectos de los artículos del decreto y también la reglamentación que permitía el ingreso de los capitales privados a los clubes.