Huxe, la app de los creadores de NotebookLM, engancha con IA

Los creadores de NotebookLM lanzan Huxe, una app móvil que convierte cualquier contenido en un podcast con dos voces virtuales. Suena natural, engancha y abre debate sobre cómo vamos a consumir información a partir de ahora.

El equipo que parió NotebookLM ha vuelto a hacer de las suyas. Se llama Huxe, es una app de audio con IA y, según los que ya la han probado, engancha como pocas cosas hayan salido este año. La idea suena sencilla pero tiene truco: tú subes el contenido (un PDF, un enlace, lo que sea) y dos presentadores virtuales se ponen a debatirlo como si llevaran toda la vida grabando juntos. Suena raro hasta que lo pruebas.

El concepto no es totalmente nuevo. NotebookLM, la herramienta gratuita de Google que arrasó en 2024, ya hacía esto mismo dentro del navegador y dejó a medio internet con la mandíbula desencajada. Pero Huxe traslada esa magia conversacional al móvil y le añade una capa de personalización que cambia bastante el juego.

Qué hace exactamente esta app

La mecánica es la de NotebookLM llevada a otro nivel. Le pasas material —un artículo, un paper, un capítulo de libro, transcripciones, lo que tengas— y Huxe te genera un episodio de audio en el que dos voces sintéticas charlan, se interrumpen, se ríen, hacen preguntas tontas y resumen lo importante. Lo de hablar como humanos ya estaba; lo nuevo es que ahora puedes pedirles que se centren en un ángulo concreto, que profundicen en un punto o que cambien el tono. Como dirigir un podcast sin tener que grabar nada.

Publicidad

Hipertextual la ha probado y describe la experiencia con una palabra que aquí en la redacción nos chirría cuando se usa a la ligera, pero esta vez encaja: adictiva. La razón es que el formato audio es el ideal para consumir contenido denso mientras haces otra cosa, y la calidad de las voces ha dado un salto bestial respecto a generaciones anteriores. Nada de robot leyendo párrafos. Esto suena a podcast hecho por dos amigos que se conocen.

Contenido infinito

Si lo piensas dos segundos, esto pinta a uno de esos episodios de Black Mirror en los que la tecnología se inventa un problema para venderte la solución. Hasta ahora, el cuello de botella del consumo de información era el tiempo: hay más artículos, libros y vídeos de los que cualquier humano puede procesar en una vida. Huxe propone otra cosa: convertir cualquier texto en audio infinito y personalizado, listo para escuchar mientras corres, conduces o friegas los platos.

El detalle que todo el mundo está pasando por alto es que esto cambia la relación con la información. Ya no lees, escuchas un resumen mediado por dos voces que deciden qué es importante y qué no. Si el modelo se equivoca o sesga, el sesgo viaja contigo en los auriculares. Y como suena natural, te lo crees más.

El equipo de NotebookLM ha sido uno de los pocos que en los últimos dos años ha conseguido que una función de IA generativa se vuelva viral por mérito propio, sin necesidad de campaña agresiva. Cuando salió la opción de generar podcasts dentro de NotebookLM, en septiembre de 2024, X se llenó de gente compartiendo episodios sobre temas absurdos: manuales de instrucciones, listas de la compra, el currículum del propio usuario. Funcionó por la sorpresa, sí, pero también porque el resultado era sorprendentemente bueno.

Que ahora ese mismo equipo lance una app independiente sugiere dos cosas: que ven negocio (el modelo gratuito limitado dará paso, casi seguro, a una suscripción) y que el formato audio generativo va a ser el siguiente gran campo de batalla después del chat y la imagen. Spotify ya está experimentando con voces clonadas para traducir podcasts. ElevenLabs vende su API a estudios enteros. Y Google, con Gemini detrás, tiene la artillería para escalar esto a niveles industriales. La pregunta no es si Huxe triunfará, sino quién va a copiarla primero y cómo de rápido. Apple, te miro a ti.

Mientras tanto, el usuario gana una herramienta brutal y un nuevo problema: decidir qué merece la pena escuchar cuando todo se puede convertir en podcast en cuarenta segundos.