Google ha soltado un modelo de código abierto para programar que te hace olvidar los rate limits de Claude Code. Gemma 4 12B se ejecuta en local con 16 GB de RAM, es multimodal y presume de benchmarks que se acercan a los de la herramienta de pago de Anthropic.
Ni encoders separados ni historias: así procesa Gemma 4 imágenes y audio
Google ha metido 12 mil millones de parámetros en una arquitectura que procesa texto, imágenes y audio sin módulos independientes. Todo entra directamente al backbone del modelo, lo que reduce latencia y consumo de memoria. La ventana de contexto alcanza los 256.000 tokens, así que si trabajas con documentación extensa o proyectos con muchos archivos, no se queda a medias.
Los resultados en benchmarks son contundentes. En LiveCodeBench, Gemma 4 12B pasó del 29,1% al 80,0% respecto a su versión anterior. Y en Codeforces ELO llegó a 2.150, territorio de programador competitivo experto. No es un modelo de juguete.
Esta capacidad de de comprender imágenes y audio de forma nativa le permite reducir el consumo de memoria y la latencia. Además, la integración multimodal no penaliza la velocidad de respuesta, algo que modelos más grandes sí sufren cuando añaden componentes extra.
Estamos ante un modelo que te da el 80% de la calidad de Claude Code sin pagar un céntimo y con tu código a salvo de servidores ajenos.
Instalación sin dolores de cabeza: Ollama, VS Code y un comando
Si no tienes experiencia con modelos locales, la opción amigable es LM Studio. Para los que se mueven en terminal, Ollama es la vía rápida. Solo necesitas descargarlo primero de la web oficial . Luego ejecutas ollama run gemma4:12b y ya tienes el servidor local listo para cualquier herramienta compatible con su API.
En VS Code, la extensión Continue te conecta directamente apuntando el endpoint a http://localhost:11434. Desde ahí puedes pedir completado de código, refactorización, tests o explicaciones sin salir del editor. Si prefieres trabajar desde terminal, OpenCode se configura con un par de archivos JSON y también reconoce el modelo. Eso sí, Ollama descarga el modelo de la memoria tras cinco minutos de inactividad; si no quieres esperar a la carga en frío, añade OLLAMA_KEEP_ALIVE='-1' en tu ~/.zshrc.
¿Supera a Claude Code? La respuesta corta es: para el día a día, sí
Claude Code sigue ganando en refactorizaciones complejas, decisiones arquitectónicas y cadenas de herramientas muy largas. Pero para el 70% de las tareas rutinarias —boilerplate, tests, explicación de errores— Gemma 4 12B se defiende sin complejos y sin coste por token. La privacidad es el otro gran argumento: todo tu código, capturas de pantalla y documentos se quedan en tu máquina. Ideal para proyectos bajo NDA o si simplemente no quieres que tus datos pasen por terceros.
El enfoque híbrido es lo más sensato: dejas que Gemma 4 maneje el trabajo pesado y recurres a Claude cuando necesitas ese plus de razonamiento. Tu factura mensual de APIs lo agradecerá.
Hype-O-Meter
Nivel de hype: 8.5/10. Google ha clavado el equilibrio entre potencia y accesibilidad. Un modelo open source que compite con Claude Code en local y gratis no se ve todos los días. La pega es que las tareas más complejas aún requieren nube, pero para desarrollo diario es un caramelazo.
El resumen para vagos (TL;DR)
- 🎯 ¿Qué ha pasado? Google ha lanzado Gemma 4 12B, un modelo de código abierto para programar que se ejecuta en local.
- 🔥 ¿Por qué importa? Compite con Claude Code, es gratuito y mantiene tu código privado.
- 🤔 ¿Nos afecta o es solo un meme? Afecta: puedes olvidarte de rate limits y ahorrar en APIs sin renunciar a calidad.




