Publicado:
La nueva herramienta puede completar una amplia variedad de tareas repetitivas del navegador, como rellenar formularios, hacer la compra, reservar viajes e “incluso crear memes”.
La empresa estadounidense OpenAI, la desarrolladora del ‘chatbot’ ChatGPT, presentó el jueves un agente impulsado por la inteligencia artificial capaz de interactuar con sitios web como un ser humano y completar varias tareas para los usuarios, informa la compañía.
“Hoy lanzamos Operator, un agente que puede ir a la Red para realizar tareas por ti. Utilizando su propio navegador, puede ver una página web e interactuar con ella escribiendo, haciendo clic y desplazándose”, explicaron los desarrolladores en un comunicado. A Operator se le puede pedir que se encargue de una amplia variedad de tareas repetitivas del navegador, como rellenar formularios, reservar viajes, hacer la compras en línea e “incluso crear memes”.
La herramienta usa un modelo, llamado Computer-Using Agent (CUA), que interpreta capturas de pantalla e interactúa con los sitios utilizando los controles típicos del navegador, como el cursor y el ratón. El usuario describe la tarea y Operator ejecuta los pasos necesarios.
Si encuentra dificultades o comete errores, el agente puede aprovechar sus capacidades de razonamiento para autocorregirse. Cuando se atasca y necesita ayuda, como para resolver un ‘captcha’ o introducir una contraseña, simplemente devuelve el control al usuario. Una vez un humano ha resuelto manualmente el problema, este puede terminar la tarea por sí mismo o devolver el control a Operator. Además, el agente puede ejecutar varias tareas simultáneamente.
Asimismo, los usuarios pueden personalizar sus flujos de trabajo en Operator añadiendo instrucciones personalizadas, ya sea para todos los sitios o para algunos en concreto. El agente también permite guardar instrucciones para acceder rápidamente a ellas en la página de inicio.
De momento solo los usuarios estadounidenses de ChatGPT Pro mayores de 18 años pueden acceder a este nuevo agente de IA. Según Open AI, la herramienta está en desarrollo y sus capacidades todavía son limitadas. La empresa intenta recoger los comentarios de los clientes, perfeccionar las funciones de Operator y después ponerlo a disposición de otros usuarios e integrarlo directamente en ChatGPT.