Google volvió a mover el tablero de la inteligencia artificial. El miércoles 12 de marzo presentó Gemma 3, la nueva generación de sus modelos de IA de código abierto, y no tardó en lanzar un mensaje claro: es más potente, más eficiente y más segura que sus competidores, incluyendo al modelo chino DeepSeek.
Se trata del avance más ambicioso de Google en el terreno de los modelos abiertos.
¿Cómo opera Gemma 3, el nuevo IA de Google?
Gemma 3 no es un modelo único, sino una familia de modelos que varía en tamaño y capacidad, desde los 1,000 millones hasta los 27,000 millones de parámetros, lo que permite adaptar su uso desde dispositivos más modestos hasta entornos empresariales exigentes, reseña Fortune.
Google afirma que son los modelos más avanzados, portátiles y desarrollados con responsabilidad dentro de su ecosistema abierto.
Además, cuentan con una ventana de contexto de 128,000 tokens, es decir, pueden procesar y recordar una gran cantidad de información al mismo tiempo. Esto les permite mantener el hilo de conversaciones largas o manejar documentos complejos sin perder precisión, algo que antes solo ofrecían los gigantes como Llama o DeepSeek.
Según Google, Gemma 3 supera no solo a DeepSeek-V3, sino también a modelos como Llama-405B de Meta y o3-mini de OpenAI. El punto clave está en su balance entre rendimiento y eficiencia, ya que es el modelo más potente que puede ejecutarse en un solo chip acelerador de IA.
Esto lo hace ideal para desarrolladores que buscan resultados potentes sin requerir grandes infraestructuras.
Otra novedad destacada es ShieldGemma 2, una herramienta de moderación de imágenes basada en este modelo, capaz de identificar contenido sensible como violencia o imágenes sexuales, lo que refuerza el enfoque de seguridad y responsabilidad de Google con sus herramientas abiertas.
Junto con Gemma 3, la compañía también mostró avances en robótica a través de su división DeepMind. En colaboración con Apptronik, Google ha integrado su modelo Gemini 2.0 en dos nuevos sistemas inteligentes para robots: Gemini Robotics, que convierte el lenguaje en acciones físicas, y Gemini Robotics-ER, que se enfoca en el razonamiento.
Ambos modelos incluyen mecanismos de seguridad para evaluar el riesgo de las acciones, una preocupación clave cuando se combinan capacidades físicas con inteligencia artificial.