La IA fue el tema principal -en ocasiones, se diría que el único tema- en la inauguración de la conferencia anual para desarrolladores de Google, Google I/O, que se lleva a cabo el 19 y 20 de mayo en el Shoreline Amphitheatre de Mountain View, California. Durante esos dos días, Google compartirá con su comunidad de desarrolladores, así como con el público en general, sus principales novedades de productos y su hoja de ruta para esta tecnología.
Desde el primer minuto de su discurso de apertura, el CEO de la compañía, Sundar Pichai dejó claro que Google ahora basa todos sus productos en Gemini, su familia de modelos de IA. Al declarar que Google va tras una IA que no solo responde a las preguntas, sino que también actúa por su usuario, el ejecutivo declaro inaugurada la era de la IA agéntica.
Ese enfoque permeó la práctica totalidad de los anuncios, que comenzaron en el buscador. Pichai dijo: “Al entrar en esta era agéntica, la Búsqueda será más útil y poderosa que nunca. Hoy presentamos agentes de información en Search. Son agentes de IA personalizados que puedes configurar para trabajar en segundo plano, 24/7, para encontrar lo que necesitas en el momento justo y ayudarte a actuar. Los agentes de información se están desplegando este verano empezando por los suscriptores de Google AI Pro y Ultra”.
Gemini 3.5 Flash
Luego de lanzar, hace varios meses, la familia de modelos Gemini 3, Google la describe como “la serie con mayor adopción hasta ahora”. Llega ahora Gemini 3.5 Flash, el primero de una serie de modelos que, en palabras de Pichai, “combinan inteligencia de vanguardia con acción”.
El CEO explicó: “En comparación con 3.1 Pro, 3.5 Flash obtiene mejores resultados en casi todos los parámetros de referencia. Logró enormes avances en programación, sin hablar del salto extraordinario en GDPVal. Esto captura muchas tareas reales con valor económico. Gemini 3.5 Flash es un modelo muy potente, a la vanguardia y comparable con los mejores, pero sin perder velocidad”. GDPVal es un benchmark desarrollado por OpenAI.
Gemini Spark
El anuncio más importante en ese entorno es un agente personal de IA llamado Gemini Spark. El sistema, explicó Google, está diseñado para elevar a Gemini de un simple chatbot y convertirlo en un asistente digital activo que realiza tareas de forma autónoma, incluso mientras el usuario duerme o está ocupado.
Por eso, expertos como los de Mashable no dudaron en calificar a Spark como la respuesta de Google a soluciones de agentes consolidadas como Claude Cowork de Anthropic y ChatGPT Agent de OpenAI, así como con el emergente OpenClaw.
Pichai, describió Spark como “el siguiente paso evolutivo en los asistentes digitales”. Agregó: “Es tu agente de IA personal, que te ayuda a navegar por tu vida digital, actuando en tu nombre y bajo tu dirección. Funciona sin problemas en máquinas virtuales dedicadas en Google Cloud, así que no tienes que mantener el portátil abierto para asegurarte de que funciona”.
Gemini Omni
Una de las novedades más anticipadas (tanto, que de hecho fue descubierto por curiosos de la IA hace algunas semanas), fue el nuevo modelo Gemini Omni que, como sugiere su prefijo, apunta a hacer “de todo” y redefinir los alcances del término “multimodal”. Se trata, en otras palabras, de un modelo capaz de crear cualquier cosa a partir de cualquier prompt, empezando por el video.
“Empezamos con resultados de video y, con el tiempo, habilitaremos imágenes y texto. Este nuevo modelo combina la inteligencia de Gemini con nuestros modelos generativos de contenido multimedia, en un gran salto en la comprensión del mundo”, dijo Pichai.
Ask YouTube
Otro anuncio interesante, aunque sin duda breve, es una nueva función que llegará a YouTube llamada “Ask YouTube”. Como su nombre sugiere, se trata de una búsqueda asistida por IA que puede gestionar consultas más complejas que los buscadores actuales.
Lamentablemente eso es, en realidad, todo lo que sabemos por ahora. Sin más detalles, los interesados en probarla pueden ir a youtube.com/new e inscribirse.
Project Genie y Street View
Project Genie de Google DeepMind ahora puede conectarse con Google Street View y generar un mundo virtual interactivo basado en imágenes reales. Está disponible desde hoy para los suscriptores de AI Ultra, si bien, por ahora, solamente con imágenes de EEUU.
SynthID
Hace un año -en el I/O 2025- Google lanzó una marca de agua digital para poder determinar rápidamente si una imagen, video, archivo de audio o fragmento de texto fue creado por alguna de sus herramientas de IA. Se llama SynthID Detector, y este año se anunció su expansión.
Ahora la tecnología SynthID llega a Google Search y Chrome. Con tan solo hacer clic derecho sobre cualquier imagen será posible comprobar si fue generada por IA. Pichai afirmó que SynthID ya ha añadido marcas de agua a más de 100 mil millones de imágenes, videos y archivos de audio.
Flow
Otra herramienta que evoluciona es Flow -también lanzada el año pasado- y que puede crear videos, imágenes y música. Este año, según reporta Wired, Google la dotó de nuevas capacidades que, dijo, apuntan personas que tienen un proyecto “pero no cuentan con el equipo de cámara, el talento musical, la experiencia en montaje, el software profesional o un conocimiento estudiado del medio para llevarlo a cabo”.
Basta subir una sola foto a Flow para que este genere 16 clips de video únicos que dan vida a esa imagen, preservando a las personas de la foto, el entorno y cualquier tipo de narrativa que pueda extraer de la imagen. Con solo subir un breve esbozo de una melodía, Flow la puede convertir en una canción con producción de estudio.
Las gafas… otra vez
Solamente no las llames Google Glasses. La empresa se refiere a ellas como inteligent eyewear y funcionan sobre Android XR, la plataforma que desarrolló con Samsung y Qualcomm.
El primer modelo que llegará al mercado es una alianza con Gentle Monster y Warby Parker. Se trata de unas gafas inteligentes que integran el asistente de voz de la firma. Basta decir "Hey, Google" o tocar el lateral del marco para acceder instantáneamente a Gemini y hacer preguntas o pedirle ayuda.
Google dice que sus gafas pueden buscar opiniones sobre locales o productos, dar instrucciones de navegación, gestionar llamadas, enviar mensajes de texto y haz que Gemini resuma los mensajes perdidos… todo sin necesidad de sacar el celular. Las respuestas llegan de viva voz mediante un altavoz en el marco. También hacer traducciones en tiempo real y pueden tomar fotos y grabar videos de alta definición.
Ver 0 comentarios