Si alguna vez le has pedido a ChatGPT que invente un nombre para un personaje y te ha soltado un 'Marcus Chen' o una 'Elena Vaquez', no es una coincidencia. La IA no está siendo creativa: está jugando a la estadística, y un nuevo estudio acaba de demostrarlo.
El patrón fantasma que nadie se explica
El fenómeno es tan repetitivo que los investigadores lo han bautizado como 'The Ghost Couple' (la pareja fantasma). Cuando los modelos de lenguaje generan ficción sin instrucciones específicas sobre el nombre, vuelven una y otra vez a un puñado de combinaciones. Elena Vaquez y Marcus Chen aparecen como vulcanólogos, astronautas, protagonistas de thriller y hasta coautores académicos en cientos de documentos generados por IA. Ninguno de ellos ha existido jamás.
Los datos del estudio, publicado en arXiv el 1 de junio, muestran que estos nombres no son aleatorios. Elena es el nombre de bebé número 42 en EE. UU., con unas 100.000 personas reales. Vasquez, el apellido 117, suma 230.000. Marcus ronda el puesto 241 y Chen está entre los 100 apellidos más comunes. La IA no los saca de una guía telefónica, sino de en en el entrenamiento masivo con textos de internet: ha visto estos nombres tantas veces que se convierten en la apuesta más segura.
La estadística gana a la originalidad (y eso tiene arreglo)
Lo que parece un misterio es puro diseño. Los LLM no están programados para inventar lo más novedoso, sino para predecir la respuesta más probable que satisfaga al usuario. Si le pides un nombre ficticio, la IA va a la opción que estadísticamente es menos chocante, culturalmente neutra y difícil de resultar ofensiva. Es el equivalente a que cualquier persona, al pedirle una ciudad al azar, suelte Nueva York o Londres. La memoria probabilística pesa más que la creatividad.
La investigación revela incluso 'huellas dactilares' según el modelo. Claude prefiere el trío Elena Vasquez + Marcus Chen + Amara Okafor; Gemini se va a Aris Thorne y Lena Petrova; GPT se decanta por Elara Voss. Cada versión deja una firma en los nombres que genera, una firma que se queda incrustada en la web cada vez que alguien publica un texto generado con IA sin retocarlo. El ciclo de 'AI slop' se retroalimenta: más contenido sintético, más entrenamiento sobre ese mismo contenido, más nombres fantasma.
La IA no está diseñada para crear, sino para predecir la respuesta más probable. Y en el caso de los nombres, la mejor predicción es la que ya ha visto un millón de veces.
El truco de prompt que desbloquea nombres únicos
La buena noticia es que puedes escapar de este bucle con un simple ajuste en el prompt. Forbes recoge una plantilla que obliga al modelo a salirse del guion: 'Genera el nombre de una persona ficticia. Evita nombres comodín muy comunes o nombres que hayas usado con frecuencia en respuestas anteriores. Evalúa si se parece a un nombre genérico que una IA generaría habitualmente. Si es así, descártalo y genera otro. Muéstrame el nombre final'.
Con esta instrucción, la IA se ve forzada a autoexaminarse y romper su inercia estadística. No es infalible, pero reduce drásticamente la repetición de 'Elena Vaquez' y compañía. El estudio incluso propone técnicas más avanzadas, como usar generadores de números aleatorios para romper los patrones. Para cualquier creador de contenido que use IA a diario, es la diferencia entre un personaje con alma y un clon.
📱 El TL;DR (Too Long; Didn't Read)
- 👤 De quién hablamos: De todas las IAs generativas que inventan nombres para historias – desde ChatGPT hasta Claude o Gemini.
- 📲 En qué red social ha pasado: El fenómeno se gesta en los propios modelos de lenguaje y salpica a cualquier plataforma que publique contenido generado por IA.
- 🔥 Por qué es viral: Porque los creadores de contenido hartos de ver siempre los mismos 'Marcus Chen' y 'Elena Vaquez' ahora tienen la explicación científica y el truco de prompt para evitarlo.



