¡Usaste ChatGPT! Las pistas que delatan que un texto fue escrito con el chatbot de OpenAI

Tal como analizamos en ChatGPT desafía a la docencia, el creciente empleo de sistemas de inteligencia artificial generativa trajo consigo beneficios a la hora de crear contenido y, en paralelo, una serie de aspectos que generan preocupación y deben ser atendidos. Uno de los inconvenientes que ha surgido es la dificultad para distinguir fehacientemente el contenido real —creado por humanos— del sintético. El caso de los textos es particularmente acuciante.

La polémica bulle especialmente en los ámbitos académicos, en los que se registran numerosísimos casos de estudiantes que entregan trabajos íntegramente escritos por modelos como ChatGPT de OpenAI o Gemini de Google. Ocurre que esas herramientas son realmente eficaces para la redacción: el usuario anota una serie de instrucciones, y los programas revisan sus bases de datos para, en pocos segundos, crear textos extensos.

Una de las grandes habilidades de ChatGPT es la redacción de texto.
Una de las grandes habilidades de ChatGPT es la redacción de texto.Por: AP

En el contenido audiovisual, por ejemplo en imágenes y videos, la elucidación podría ser más sencilla. Por caso, algunos desarrolladores han comenzado a incluir marcas de agua para mostrar sin rodeos cuándo se trata de una creación sintética. En los escritos, la identificación encierra mayores complejidades. En este marco, ¿hay modos eficientes de identificar si un texto fue escrito por ChatGPT y afines?

Un investigador revela el secreto para delatar a los textos generados con ChatGPT

A poco del lanzamiento general de su chatbot, OpenAI lanzó una herramienta que prometía identificar los escritos creados con esa herramienta. Más tarde, se supo que ni siquiera esa solución resultó eficiente, en la mayoría de los casos. Frente a tal escenario, el discernimiento humano sigue siendo la variable fundamental.

A esa dirección apuntó un investigador especializado en ciencia de datos, Fareed Khan, que en una entrada de blog en Medium comprobó cuáles son las palabras que más usa ChatGPT en los textos que genera. Así, funcionan como pistas para buchonear a los escritos generados con el chatbot de OpenAI.

El gráfico muestra el exponencial crecimiento en el uso de la palabra "delve". (Fuente: Fareed Khan/Medium)
El gráfico muestra el exponencial crecimiento en el uso de la palabra «delve». (Fuente: Fareed Khan/Medium)

Para esto, Khan insertó en una base de datos miles de textos publicados en blogs y reunió 19.000 millones de palabras. Uno de los ejemplos que usó es el término “delve” (“ahondar” en español), que en 2010 apenas se usó y se multiplicó exponencialmente desde la aparición de ChatGPT. En tanto, aquella es una de las palabras “favoritas” del modelo GPT y una pista que delata a los escritos con ese sistema. Otros términos como “unmavering” (“inquebrantable”), “pivotal” (“esencial”) “nanscent” (“naciente”) y “intricacies” (“complejidades”) también se repiten con gran frecuencia en la actualidad.

Los interesados pueden revisar el informe de Khan, en el que se listan 100 palabras tan habituales en los discursos de ChatGPT, que podrían servir como huellas para la detección de textos sintéticos.

More from the blog

Gran acto del Partido Justicialista en Barranquerras con la presencia de Ricardo Quintela, Magda Ayala y grandes politicos del Chaco y el Pais

a ciudad de Barranqueras vivió una jornada memorable con la visita del Gobernador de La Rioja, Ricardo Quintela, quien junto a la Intendenta Magda Ayala, inauguró la nueva sede partidaria en un evento lleno de mística y fervor militante acompañados por intendentes, diputados, senadores, gremios y sindicatos

El socio de Santiago Caputo que maneja la pauta de YPF gastó 10 mil millones en los primeros tres meses de Milei

Guillermo Garat, socio de Santiago Caputo, es el vicepresidente de YPF a cargo de la publicidad. Los vínculos con Wado y el camporista Patucho Alvarez.

Llaryora dispuesto a negociar el gabinete con Schiaretti para que sea candidato contra Milei

Lejos de la jubilación que le auguraban, el ex gobernador mantiene una imagen altísima. Llaryora lo necesita para no perder Córdoba.

En Corrientes, allanaron un campo de cítricos y detectaron 20 personas víctimas de explotación laboral

La Administración Federal de Ingresos Públicos (Afip) informó este viernes que llevó adelante un operativo en una finca dedicada al cultivo de cítricos ubicada en Juan Pujol, provincia de Corrientes, en el que se detectaron severas irregularidades. En el lugar había 17 trabajadores, oriundos de Entre Ríos, y 14 de ellos no estaban registrados. Además, otros tres habían llegado para tareas de poda. Los trabajadores dormían en un colectivo abandonado y no contaban con baño ni cocina.