Alguien en Mountain View ha decidido que ya basta de ir por detrás en programación e inteligencia agéntica: Gemini 3.5 Flash es la respuesta. Presentado durante el I/O 2026, el modelo no solo supera a Gemini 3.1 Pro en múltiples benchmarks, sino que lo hace manteniendo el coste y la velocidad de la familia Flash. O sea, rendimiento Pro a precio de Flash, y hasta cuatro veces más rápido que cualquier rival en tokens por segundo.
Qué hace exactamente este modelo y por qué es tan rápido
Lo primero, los números: supera a a Gemini 3.1 Pro en programación, tareas agénticas y pruebas multimodales. Google insiste en que esta versión equilibra velocidad, coste y rendimiento como nadie, y que está pensada para tareas de larga duración sin quedarse mirando al infinito. La clave está en la latencia: genera hasta 4 veces más tokens por segundo que los modelos de frontera rivales, según los datos mostrados en la keynote. Eso, en plata, significa que un agente que antes tardaba un minuto en decidir, ahora lo hace en quince segundos. Y además dibuja gráficos más ricos y hasta animaciones para papers, porque Google ha decidido meterle diseño también.
La pelea por el trono de la programación: Gemini vs Claude vs ChatGPT
Hasta ahora, si querías un modelo que programara bien sin alucinar demasiado, ibas a Claude. Si querías uno con ecosistema y comunidad, ChatGPT. Google sabía que se le escapaba ese segmento y ha reaccionado. Gemini 3.5 Flash ya está integrado en la app de Gemini, en el Modo IA del buscador, en Android Studio y en toda la plataforma Enterprise. Es una maniobra agresiva: no esperan a que los desarrolladores adopten el modelo por su cuenta, lo meten directamente en el stack de Google y a correr. Además, han mejorado las salvaguardias, lo que suele ser un eufemismo para “intentamos que no se descontrole”.
Por qué Google se la está jugando con esta apuesta
El historial de Google en IA generativa ha sido una montaña rusa: primero Bard fue un meme, luego Gemini 1.0 nos dejó a cuadros con sus capacidades, y después llegaron las iteraciones rápidas para no perder comba. Esta vez, en lugar de sacar un modelo Pro caro y lento, han elegido la estrategia Flash: algo ligero pero capaz, que se ejecuta en producción sin arruinar a nadie. La verdadera prueba de fuego será ver cómo se comporta con prompts de 10.000 tokens de código o con agentes que encadenan decenas de pasos en un entorno real, no solo en el laboratorio.
La jugada no termina aquí. En junio aterrizará Gemini 3.5 Pro, una versión aún más potente que ya está en pruebas. Si Flash ya supera a Pro, ¿qué demonios hará Pro? La respuesta definirá si Google recupera el terreno perdido o sigue siendo el tercero en discordia.
Hype-O-Meter
Nivel de hype: 7.5/10. Los números de velocidad y rendimiento son contundentes, y la integración inmediata en productos reales es una declaración de intenciones. Pero hasta que los benchmarks no se traduzcan en código que funcione en producción y agentes que no se lían, la cautela manda. Aún huele a demo de keynote, aunque las medallas ya no son de latón.
El resumen para vagos (TL;DR)
- 🎯 ¿Qué ha pasado? Google lanza Gemini 3.5 Flash, un modelo que supera a su antecesor Pro en programación y tareas de agente.
- 🔥 ¿Por qué importa? Porque es hasta 4 veces más rápido que Claude y ChatGPT, y ya está integrado en Gemini, el buscador y Android Studio.
- 🤔 ¿Nos afecta o es solo un meme? Nos afecta si programas o usas IA a diario; la guerra de los agentes se pone seria y barata.



