Gemini 2.5 Computer Use: la IA de Google que busca, analiza y navega por ti

El modelo Gemini 2.5 Computer Use puede usar la web como lo hace un humano.

Google presenta Gemini 2.5 Computer Use
Google presenta Gemini 2.5 Computer Use

Google ha estado dando pasos importantes en la evolución de la inteligencia artificial, hace poco libero Opal a más países y ahora pone en marcha Gemini 2.5 Computer Use, se trata de un nuevo modelo capaz de navegar e interactuar directamente con la web para completar tareas por sí mismo. La compañía ha puesto a disposición la versión de prueba del modelo, que puede probarse desde Google AI Studio y Vertex AI.

Este nuevo modelo forma parte de las denominadas capacidades agénticas o Agentes IA, que pueden manejar aplicaciones y páginas web del mismo modo que lo haría una persona. Gemini 2.5 Computer Use es multimodal, lo que significa que comprende texto, imágenes y contexto visual para ejecutar acciones complejas que se basan en las instrucciones del usuario.

Google presenta Gemini 2.5 Computer Use
Google presenta Gemini 2.5 Computer Use

Gemini 2.5 Computer Use: una IA que actúa dentro del navegador

Según la propia Google, este modelo puede: rellenar formularios, enviar solicitudes, resumir noticias o extraer datos precisos de una página web. Este modelo es uno de sus más destacados, ya que tiene la capacidad de probar la interfaz sin tener una API asociada.

El modelo puede realizar acciones como abrir páginas, escribir texto, hacer clic, arrastrar elementos o seleccionar opciones, todo dentro de un entorno de navegador.

Este sistema ha sido diseñado con un enfoque seguro, no accede al entorno completo del ordenador, sino únicamente a la navegación. Esto permitirá mantener el control del usuario mientras la IA automatiza tareas o realiza investigaciones.

Estamos a un paso hacia los agentes autónomos de Google

Este nuevo lanzamiento continúa la línea de proyectos como Project Mariner, en donde agentes de IA ya eran capaces de añadir artículos a un carrito de compra a partir de una lista de ingredientes, simulando un asistente personal. Según informa The Verge, las versiones anteriores de Gemini ya habían mostrado estas funciones dentro del Modo IA de Google Search, que hoy se expande oficialmente a España.

Este modelo supera en rendimiento a las principales alternativas en pruebas comparativas, tanto en tareas web como en interacción móvil, según datos de la propia compañía. Sin embargo, competidores como Anthropic, con Claude, ya ofrecían una IA capaz de controlar el ordenador, Google apuesta por una integración más acotada y segura, solamente se limita al navegador.

Cómo probar Gemini 2.5 Computer Use

Actualmente, el modelo ya está disponible para los desarrolladores en Google AI Studio y Vertex AI, aunque la compañía ofrece una demo pública interactiva para probar cada una de sus capacidades. En el modelo de prueba, el modelo realiza una demostración de cómo puede jugar al clásico 2048, explorar debates en Hacker News o resumir los comentarios más polémicos del día.

Con esta tecnología, Google se acerca a un futuro en el que los asistentes de IA pueden realizar tareas reales en la web, desde hacer compras hasta gestionar formularios o recopilar información, todo bajo instrucciones de lenguaje natural.

Soy una apasionada de la informática, escribo artículos sobre tecnología en general con más de 8 años de experiencia, cubriendo las últimas innovaciones en hardware, software y las últimas tendencias digitales.