Google lanza Gemini 3 Flash: la IA más rápida y barata que ahora manda en la app de Gemini
El nuevo modelo flash de Gemini 3 será encargado de impulsar las busquedas que hagas desde tu teléfono Android a partir de ahora
El nuevo modelo de IA es el más rápido y económico con el que cuenta Google hasta los momentos Crédito: Shutterstock
Google ha dado otro golpe sobre la mesa en la carrera de la IA generativa: este miércoles lanzó Gemini 3 Flash, una nueva versión más rápida y pensada para ser más barata en uso que su modelo tope de gama, y además la convirtió en el modelo predeterminado de la app de Gemini y del modo IA en la búsqueda. Con este movimiento, la compañía quiere que este modelo sea el “caballo de batalla” que la mayoría de usuarios y empresas utilicen en su día a día.
Qué es exactamente Gemini 3 Flash
Gemini 3 Flash es el modelo “rápido y barato” construido sobre la familia Gemini 3, presentada por Google el mes pasado como su nueva generación de modelos avanzados de IA. Llega como sucesor directo de Gemini 2.5 Flash, pero con un salto importante en rendimiento: en varios benchmarks se acerca a modelos de gama alta como Gemini 3 Pro y GPT‑5.2, algo poco habitual en modelos optimizados para coste y velocidad.
En el benchmark “Humanity’s Last Exam”, pensado para medir conocimientos avanzados en múltiples dominios, Gemini 3 Flash logró un 33,7% sin usar herramientas, frente al 37,5% de Gemini 3 Pro, el 11% de Gemini 2.5 Flash y el 34,5% de GPT‑5.2, lo que muestra lo mucho que ha recortado distancia con los modelos punteros. En el test MMMU‑Pro, centrado en razonamiento multimodal, el nuevo modelo incluso superó a todos sus rivales, con una puntuación del 81,2%, reforzando la idea de que no es solo “rápido y barato”, sino también muy competitivo en calidad.
Otra pieza clave es su capacidad multimodal: Gemini 3 Flash está diseñado para entender y combinar texto, imágenes, audio e incluso vídeo dentro de la misma conversación, sin obligar al usuario a cambiar de herramienta o modelo. Esto lo posiciona como una opción versátil tanto para tareas cotidianas de usuarios finales como para flujos de trabajo más complejos en empresas y desarrolladores.
Más rápido, más barato y con mejores resultados
Aunque Google lo vende como un modelo “rápido y barato”, el precio por token de Gemini 3 Flash es ligeramente superior al de su predecesor, pero la clave está en el rendimiento global. El coste es de $0.50 dólares por millón de tokens de entrada y $3 dólares por millón de tokens de salida, frente a los $0.30 y $2.50 dólares por millón de tokens de Gemini 2.5 Flash, respectivamente. Sin embargo, Google afirma que el nuevo modelo supera al antiguo Gemini 2.5 Pro y, además, es tres veces más rápido, algo crucial para aplicaciones que requieren respuestas inmediatas o procesamiento masivo.
La compañía también destaca que Gemini 3 Flash usa de media un 30% menos de tokens para tareas de “pensamiento” que 2.5 Pro, lo que significa que, aunque el precio por millón de tokens sea algo mayor, el coste total de muchas tareas puede terminar siendo más bajo. En términos prácticos, esto se traduce en que las empresas pueden procesar más peticiones al mismo coste o reducir la factura manteniendo el mismo volumen de trabajo.
Google describe a Gemini 3 Flash como un “modelo de carga de trabajo” o workhorse, pensado para manejar tareas en volumen: generación de contenido, análisis de datos, clasificación de información, resúmenes, asistentes internos y otras funciones donde importa tanto el coste como la latencia. Gracias a su velocidad y a su rendimiento cercano a los modelos tope de gama en varios benchmarks, Flash se coloca como el candidato ideal para ser el motor principal de muchos productos y servicios basados en IA.
En el terreno de la competencia, el lanzamiento llega en pleno pulso con OpenAI, que recientemente sacó GPT‑5.2 y un nuevo modelo de generación de imágenes, después de que se filtrara un supuesto “código rojo” interno alertando de una caída de tráfico de ChatGPT a la vez que subía la cuota de Google en consumo de IA. El mensaje implícito de Google es claro: no solo puede seguir el ritmo, sino que quiere marcarlo con lanzamientos frecuentes y modelos optimizados para distintos casos de uso.
Qué cambia para usuarios y desarrolladores
A partir de ahora, Gemini 3 Flash será el modelo que se ejecutará por defecto en la app de Gemini en todo el mundo, reemplazando a Gemini 2.5 Flash como opción estándar. Los usuarios seguirán pudiendo cambiar manualmente a Gemini 3 Pro desde el selector de modelo, especialmente para tareas más exigentes como problemas de matemáticas complejas o programación avanzada, pero la experiencia general estará centrada en Flash. Además, este modelo también se convertirá en la base del modo IA en la búsqueda de Google, lo que amplía enormemente su alcance.
En el uso cotidiano, Google asegura que Gemini 3 Flash es especialmente bueno para interpretar contenido multimodal y devolver respuestas útiles a partir de vídeo, audio, imágenes o combinaciones de estos formatos. Puedes, por ejemplo, subir un vídeo corto jugando pickleball y pedir consejos, dibujar un boceto para que el modelo intente adivinar qué estás creando o cargar una grabación de audio para obtener análisis o cuestionarios generados automáticamente. También promete respuestas más visuales, con elementos como tablas e imágenes cuando tenga sentido, algo clave para mejorar la comprensión y la experiencia en móvil.
Otro punto interesante es que desde la app de Gemini se podrán crear prototipos de apps solo con prompts, aprovechando las capacidades de razonamiento y generación de código del modelo. Esto encaja con la estrategia de Google de integrar Gemini tanto en productos de consumo como en herramientas para desarrolladores y entornos empresariales.
Del lado corporativo, compañías como JetBrains, Figma, Cursor, Harvey y Latitude ya están usando Gemini 3 Flash a través de Vertex AI y Gemini Enterprise, consolidando al modelo como opción seria para entornos profesionales. Para desarrolladores independientes, el modelo estará disponible en versión de vista previa vía API y también dentro de Antigravity, la nueva herramienta de programación de Google lanzada el mes pasado, pensada para facilitar el desarrollo asistido por IA.
Con más de un billón de tokens procesados al día en su API desde el lanzamiento de Gemini 3, Google deja claro que no piensa aflojar en la carrera por la IA generativa. Convertir a Gemini 3 Flash en el modelo predeterminado de la app y de la búsqueda es un mensaje directo al mercado: la compañía quiere que esta versión sea la puerta de entrada masiva a su ecosistema de IA, combinando velocidad, costes ajustados y un rendimiento que ya compite con los grandes modelos de referencia.
Sigue leyendo:
• Cómo desactivar herramientas de inteligencia artificial como Gemini, Apple Intelligence, Copilot y otras
• Gemini 3 ya es oficial: la IA de Google es más inteligente, rápida y visual que nunca
• Google Gemini: La IA que revive tu teléfono antiguo