
Getting your Trinity Audio player ready... |
OpenAI presentó Operator, su nuevo agente de inteligencia artificial capaz de realizar tareas en línea de manera autónoma. Operador destaca por su capacidad para transformar la interacción en tareas en el mundo online, por ejemplo puede realizar la reserva de un viaje.
Con Operador el usuario tiene la capacidad de planificar vuelos e incluso gestionar alojamientos y transporte terrestre. Pero eso es sólo es una de sus capacidades, Operator es una herramienta valiosa al agilizar procesos que antes requerían múltiples pasos manuales.
El lanzamiento de Operador se convirtió en el nuevo hito en la evolución de los agentes de IA.
¿En qué se diferencia Operator de ChatGPT?
Diseñado como una herramienta de propósito general, Operator simplifica tareas al extender su funcionalidad a actividades como hacer compras en línea, reservar mesas en restaurantes, organizar entregas y hacer otras actividades relacionadas con viajes.
Destaca por su capacidad para operar directamente en navegadores web, simulando la interacción humana, esto lo convierte en una opción ideal para quienes buscan ahorrar tiempo y reducir la fricción al usar interfaces digitales.
Aunque ambos son productos de OpenAI, Operator y ChatGPT tienen enfoques muy distintos. Mientras que ChatGPT es un modelo conversacional que responde preguntas y genera texto, Operator actúa como un asistente autónomo, capaz de llevar a cabo acciones directamente en el navegador web. Por ejemplo, en lugar de solo recomendar hoteles en una ciudad, Operator puede buscarlos, comparar opciones, y completar la reserva según las preferencias del usuario.
La diferencia clave radica en la autonomía operativa de Operator, que lo posiciona como una herramienta práctica y activa, más allá de la interacción textual que ofrece ChatGPT.
Conoce cómo funciona Operator de OpenAI
La tecnología detrás de Operator se basa en el modelo Computer-Using Agent (CUA), que combina las capacidades de visión de GPT-4 con un razonamiento avanzado. Este modelo permite al agente «ver» capturas de pantalla y «actuar» usando acciones como clics, desplazamientos y llenado de formularios, replicando la forma en la que interactúa un humano con una página web.
Cuando se le asigna una tarea, como reservar un vuelo, Operator navega por los menús, introduce la información necesaria y solicita confirmación antes de finalizar cualquier acción importante, como realizar un pago.
Entonces ¿qué sucede si Operador encuentra un CAPTCHA? Si encuentra un obstáculo, como un CAPTCHA o una interfaz inusual, puede devolver el control al usuario para asegurar un flujo de trabajo continuo y colaborativo.
Quiénes pueden usar Operator, cuáles son sus limitaciones y qué sigue
Por el momento, está disponible como parte de un programa de vista previa para los usuarios del plan Pro en los Estados Unidos, con un costo mensual de $200. OpenAI planea expandir gradualmente el acceso a otros niveles de suscripción, incluidos Plus, Team y Enterprise, además de su futura integración en la plataforma de ChatGPT.
A futuro también se espera que el servicio se extienda a más regiones, aunque Europa deberá esperar un poco más debido a ajustes normativos.
El futuro de Operator es prometedor. OpenAI planea habilitar el modelo CUA en su API, permitiendo a los desarrolladores crear sus propios agentes personalizados para casos de uso específicos. Además, la compañía trabajará en mejorar las capacidades del agente para gestionar flujos de trabajo más largos y complejos, eliminando gradualmente limitaciones actuales como las dificultades con sistemas altamente personalizados o la interacción con sitios sensibles, como los relacionados con operaciones bancarias.
El lanzamiento de Operator marca un enorme avance sobre cómo los usuarios interactúan con servicios digitales. Aunque aún enfrenta algunas limitaciones, el potencial de Operator para transformar la experiencia del usuario y ofrecer soluciones automatizadas en tiempo real es innegable.
A medida que OpenAI optimice el código de Operator, esta trcnología cambiará para siempre el papel que la IA tiene en nuestras vidas. Para quienes aún dudan de la IA, solo el tiempo mostrará cómo estas herramientas pueden democratizar el acceso a servicios y optimizar el uso de nuestro tiempo, en un mundo cada vez más impaciente y digital.