Startseite / Der 'ChatGPT'-Operator sucht das Internet für dich.

Der 'ChatGPT'-Operator sucht das Internet für dich.

24.01.2025 04:39:55
OpenAI hat seine erste AI-gesteuerte Agentin "Operator" eingeführt, die komplexe Aufgaben wie das Buchen von Restaurantreservierungen und Online-Shopping automatisieren kann. Diese Funktion ist jedoch beschränkt auf bestimmte Kategorien und erfordert bei sensiblen Websites Benutzerbestätigung. Der CUA-Modell des Betriebs wurde trainiert, direkt mit den Frontends von Websites zu interagieren. OpenAI behauptet, dass Operator die Nutzungsbedingungen seiner Einstiegspartnere einhält, obwohl er noch nicht 100% zuverlässig funktioniert und bestimmte Aufgaben wie das Erstellen von Folienpräsentationen oder Interagieren mit hoch benutzerdefinierten Web-Interfaces Schwierigkeiten aufweist. Der Operator ist derzeit als Forschungsvorschau über operator.chatgpt.com verfügbar für ChatGPT-Abonnenten in den USA auf dem teuersten $200 pro Monat ChatGPT-Pro-Plan. Rival Google hat seinen eigenen AI-Agenten im November 2024 offiziell bekannt gegeben, als Projekt Mariner.
Der 'ChatGPT'-Operator sucht das Internet für dich.
OpenAI hat heute Operator bekanntgegeben, seine erste Versuchung einer AI-gesteuernten Agentin, die komplexe Aufgaben automatisieren und verschiedene Aktionen auf Websites durchführen kann, um Ihnen Zeit zu sparen. Dies beinhaltet das Buchen von Restaurantreservierungen, Online-Shopping und die Buchung von Reiseunterkünften. Bestimmte sensITIVE Aktionen erfordern Benutzerbestätigung. "Auf besonders sensiblen Websites wie E-Mail erfordert Operator aktive Benutzersupervision, um sicherzustellen, dass Benutzer direkt auf eventuelle mögliche Fehler des Modells reagieren können," erklärt OpenAI. Das ist der Grund, warum Operator derzeit keine E-Mails senden oder Kalenderereignisse löschen kann, aber OpenAI arbeitet daran. Es gibt Automatisierungen in Kategorien wie Lieferung, Essen, Einkaufen und Reisen. Erklärungen zu den spezifischen Aktionen, die verwendet werden, werden auf dem Bildschirm angezeigt, während Operator die Automatisierung durchführt. OpenAI verwendet Entwickler-APIs, um in Webanwendungen einzubauen. Das Computer-Using-Agent (CUA)-Modell des Betriebs hat sich trainiert, direkt mit den Frontends von Websites zu interagieren, indem es seinen eigenen dedizierten Webbrowser verwendet. OpenAI behauptet, dass Operator die Nutzungsbedingungen seiner Einstiegspartnere DoorDash, eBay, Instacart, Priceline, StubHub und Uber einhält. Der Ersteller von ChatGPT erwacht nicht, dass der CUA 100% zuverlässig funktionieren wird. Die Unterstützungsdokumentation von OpenAI erkennt dies an und sagt: "Der Operator kann viele komplexe oder spezialisierte Aufgaben nicht zuverlässig durchführen." Einige Beispiele sind "Erstellen detaillierter Folienpräsentationen, Verwalten komplexer Kalender-Systeme oder Interagieren mit hoch benutzerdefinierten oder nicht-standardmäßigen Web-Interfaces". Der Operator hat jedoch auch andere Nachteile wie Aufgaben-spezifische Ratebegrenzungen und eine allgemeine Nutzungslimitierung, die täglich zurückgesetzt wird. Außerdem kann er in einigen Aufgaben schiefgehen, wie zum Beispiel bei der Lösung eines CAPTCHA-Challenges, und hat Schwierigkeiten bei der Navigierung komplexer Web-Interfaces. Der Operator ist derzeit als Forschungsvorschau über operator.chatgpt.com verfügbar für ChatGPT-Abonnenten in den USA auf dem teuersten $200 pro Monat ChatGPT-Pro-Plan. Nutzer auf den Plus-, Team- und Unternehmensabonnements müssen geduld haben, während OpenAI den Operator an diese Abonnementsstufen bringt. Die Funktion wird "bald" in zusätzliche Sprachen und Länder erweitert. Leider wird Europa "eine Weile dauern," sagte CEO Sam Altman. OpenAI hatte früher einfache Automatisierungsfähigkeiten in ChatGPT implementiert, wie etwa den Einrichten von Erinnerungen. Aber Operator ist seine erste Versuchung, einen AI-Agenten zu erschaffen. Rival Google hat seinen eigenen AI-Agenten im November 2024 offiziell bekannt gegeben, als Projekt Mariner, als experimentelle Chrome-Erweiterung, die Webformulare für Sie ausfüllen kann, Buttons klicken und den Mauszeiger bewegen und mehr. Künstliche Intelligenz-Agenten werden als der nächste logische Schritt in der AI-Revolution angesehen. Diese Dinge versprechen, das Web für Sie zu nutzen, basierend auf Ihrem Befehl, was Ihnen das direkte Interagieren mit Websites entlastet. Allerdings ist die Nutzenkraft von KI-Agenten derzeit fraglich, insbesondere, da sie sich noch in experimentellen Phasen befinden und weit verbreitet werden werden, bis ihre Zuverlässigkeit verbessert wird.

Das könnte Ihnen gefallen