Alguien le pasó un prompt a ChatGPT, el modelo escupió un relato y acabó ganando el premio Commonwealth de narraciones breves en la categoría Caribe. El texto se publicó en Granta, la revista que desde hace décadas marca el pulso del canon literario anglófono. Cuando los lectores empezaron a sospechar, la revista hizo lo único que no debía hacer: preguntarle a otra IA si el texto era de IA. Claude dijo que no. Y el escándalo ya era imparable.
Un premio, un relato y un tuit que lo incendió todo
El pasado 18 de mayo, varios usuarios de X encendieron la mecha. El relato ganador olía a ChatGPT por los cuatro costados: metáforas sensoriales acumuladas sin criterio, esa estructura tan reconocible de «no es X, es Y» y una profusión de estímulos como «el mediodía que zumba» o «aire dulce con olor a caña y a olvido» que ningún escritor humano colocaría con esa densidad mecánica. Los modelos de lenguaje no buscan la palabra justa: generan el token estadísticamente más probable, y cuando toca sonar poético, sueltan todo el catálogo de una vez.
La foto del autor tampoco ayudaba: parecía generada. Cuando Granta respondió al escándalo, lo hizo con un gesto que resume a la perfección el momento que vive la industria: le preguntaron a Claude si el texto había sido escrito por IA. Claude dijo que no. Fin de la investigación. Si te parece un despropósito, no has visto nada todavía.
Por qué los detectores son un desastre (y lo seguirán siendo)
Reconocer la prosa de una IA a ojo es una cosa; demostrarlo con una herramienta objetiva es otra muy distinta. OpenAI retiró su AI Text Classifier en julio de 2023 tras reconocer que solo identificaba el 26% del texto generado por IA y marcaba como artificial casi el 9% de los textos humanos, según admitió la propia compañía en su web oficial. GPTZero, Originality.ai y Turnitin AI acumulan un historial de errores parecido: falsos positivos que hunden a alumnos inocentes y falsos negativos que dejan pasar los textos generados como si nada.
Los detectores de IA son como un detector de mentiras chapucero: cuando aciertan es por casualidad y cuando fallan arruinan a alguien.
La excepción que confirma la regla se llama Pangram. Su técnica de mirror data entrena al clasificador con parejas de textos estilísticamente idénticos pero de distinto origen. El primer benchmark independiente, de septiembre de 2025, le da falsos positivos cercanos a cero y falsos negativos de entre el 2% y el 4% en pasajes medios y largos. El problema: Pangram también vende un humanizador junto a sus informes, a veces con porcentajes escandalosamente altos. La herramienta que te dice si has hecho trampas es la misma que te vende la forma de esquivarla. Cierra el círculo.
En las universidades estadounidenses la cosa ya es distopía pura. Los alumnos escriben peor a propósito para no ser acusados de usar IA, los profesores pasan los trabajos por detectores que fallan más que una escopeta de feria y los humanizadores campan a sus anchas. Joseph Thibault, fundador de Cursive, ha rastreado 43 humanizadores con una audiencia combinada de 33,9 millones de visitas. Grammarly ha sacado Authorship, una herramienta que graba la sesión de escritura para que los estudiantes puedan demostrar que redactaron ellos el trabajo: cinco millones de informes generados en el último año. Una profesora lo resume con una frase que debería quedarse grabada: «Cuanto mejor escribes, la IA más cree que eres IA. Yo pongo mis propios artículos en los detectores y me marca al 98% siempre, sin haber usado IA en ningún momento».
Esto va de confianza, no de estilo
La escritora Vauhini Vara llevó el experimento al extremo. Encargó a un investigador que entrenara un modelo con sus tres libros publicados y varios artículos periodísticos para que generara pasajes de su próxima novela. Luego los mezcló con fragmentos propios y se los envió a sus amigos más cercanos. Ninguno supo distinguirlos. Los lectores tienden a preferir el texto de IA cuando no conocen el origen, pero en cuanto se les revela la fuente, el texto deja de interesarles. La conclusión de Vara es demoledora: lo que importa no es si el texto suena humano, sino saber que hay alguien de verdad al otro lado.
El escándalo de Granta no es una anécdota aislada: es el síntoma de un ecosistema entero que ya no sabe distinguir lo humano de lo sintético. Mientras las editoriales se pelean con detectores que no funcionan y las universidades se convierten en un campo de minas, la IA sigue escribiendo, ganando premios y colándose en las revistas que marcan el canon. El problema no es que los detectores no sirvan. El problema es que cada vez importa menos.
Hype-O-Meter
Nivel de hype: 8,5/10. No es un lanzamiento de producto, pero el escándalo de Granta toca todas las teclas: premios literarios, detectores que fallan, universidades en pánico y una industria editorial que no sabe hacia dónde mirar. Si esto no es el principio de una crisis de confianza masiva, se le parece muchísimo.
El resumen para vagos (TL;DR)
- 🎯 ¿Qué ha pasado? Un relato escrito con ChatGPT ganó el premio Commonwealth y se publicó en Granta.
- 🔥 ¿Por qué importa? Los detectores de IA no funcionan y el problema se extiende a universidades y editoriales.
- 🤔 ¿Nos afecta o es solo un meme? Nos afecta: la confianza en lo que leemos está en juego y nadie tiene una solución clara.



