Google ha revelado su primer agente de inteligencia artificial capaz de realizar acciones en la web, un prototipo de investigación de la división DeepMind llamado Project Mariner. Este agente, impulsado por Gemini, toma el control del navegador Chrome, moviendo el cursor, haciendo clic en botones y rellenando formularios, permitiendo navegar por sitios web de manera similar a un humano.

La compañía ha comenzado a liberar su agente de IA a un grupo reducido de probadores preseleccionados. Google está experimentando con nuevas formas para que Gemini lea, resuma y ahora utilice sitios web, marcando un cambio en el paradigma de la experiencia de usuario. Este cambio podría impactar a millones de negocios que dependen de Google para atraer visitantes reales a sus sitios.

En una demostración, el Director de Google Labs, Jaclyn Konzelmann, mostró el funcionamiento de Project Mariner. Tras configurar el agente con una extensión en Chrome, se abre una ventana de chat donde se pueden dar instrucciones al agente, como crear un carrito de compras en una tienda de comestibles. El agente navega por el sitio, busca y añade artículos al carrito, aunque con cierta lentitud y ocasionalmente solicita aclaraciones.

Project Mariner no está diseñado para completar transacciones, ya que no puede rellenar números de tarjetas de crédito ni aceptar cookies. Google asegura que estas limitaciones son intencionales para mantener el control del usuario. El agente toma capturas de pantalla del navegador, que son procesadas por Gemini en la nube, enviando luego instrucciones de navegación al ordenador.

El agente también puede buscar vuelos, hoteles, recetas y otros artículos, aunque solo funciona en la pestaña activa del navegador Chrome. Esto significa que el usuario debe observar cómo el agente realiza las tareas, una decisión deliberada para que los usuarios sepan qué está haciendo la IA. Aunque los propietarios de sitios web pueden sentirse aliviados de que el agente opere en la pantalla del usuario, podría reducir el compromiso directo de los usuarios con los sitios.

Además de Project Mariner, Google ha presentado otros agentes de IA para tareas específicas. Deep Research ayuda a explorar temas complejos creando planes de investigación en varios pasos, mientras que Jules asiste a desarrolladores en tareas de codificación integrándose en los flujos de trabajo de GitHub. Google también está desarrollando un agente para navegar en videojuegos, colaborando con desarrolladores como Supercell para probar la capacidad de Gemini en interpretar mundos de juego.

La fecha de lanzamiento de Project Mariner para el público general aún no está clara, pero su implementación podría tener un impacto significativo en el uso de la web. Aunque la web está diseñada para el uso humano, los agentes de IA de Google podrían transformar este estándar.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí