/ ChatGPT의 'Operator'가 웹을 탐색하여 당신을 돕습니다.

ChatGPT의 'Operator'가 웹을 탐색하여 당신을 돕습니다.

2025. 1. 24. 오전 4:39:55
OpenAI가 Operator를 발표했습니다: 첫 인공지능 기반 에이전트로, 복잡한 웹 작업을 자동화합니다. 특히 민감한 행동은 사용자 승인이 필요할 수 있습니다. 오픈AI는 DoorDash 등 6개 회사의 서비스 약관을 존중하며, Operator는 ChatGPT Pro 계획을 통해 연구 프리뷰로 현재 사용 가능합니다. 그러나 일부 단점과 실패 가능성도 있음을 주의해야 합니다.
ChatGPT의 'Operator'가 웹을 탐색하여 당신을 돕습니다.

OpenAI는 오늘 Operator를 발표했습니다. 이는 첫 번째 인공지능 기반 에이전트로, 복잡한 작업을 자동화하고 웹사이트에서 다양한 동작을 수행하여 시간을 절약하는 데 도움이 될 수 있는 시도입니다.

이것은 식당 예약, 온라인 쇼핑, 여행 일정 예약 등을 포함합니다. 특정 민감한 행동은 사용자 승인이 필요할 수 있습니다. "특히 민감한 웹사이트에서, 예를 들어 이메일, 오퍼레이터는 활성 사용자의 지도가 필요하며, 사용자가 모델이 가능한 오류를 직접 잡고 처리할 수 있도록 보장합니다," 오픈AI는 설명합니다. 이로 인해 오퍼레이터는 현재 이메일을 보내거나 캘린더 이벤트를 삭제하는 기능을 지원하지 않지만, 오픈AI는 이를 개발 중입니다. 배달, 식사, 쇼핑 및 여행과 같은 작업 카테고리에는 자동화가 있습니다. 오퍼레이터가 자동화를 수행할 때 사용하고 있는 특정 행동에 대한 설명이 화면에 표시됩니다.

개발자 API를 사용하지 않고 웹 앱에 연결하는 대신, 운영자의 컴퓨터를 사용하는 에이전트(CUA) 모델은 자체 전용 웹 브라우저를 사용하여 웹 사이트 프론트엔드와 직접 상호 작용하도록 훈련되었습니다. OpenAI는 Operator가 출시 파트너인 DoorDash, eBay, Instacart, Priceline, StubHub 및 Uber의 서비스 약관을 존중한다고 주장합니다.

ChatGPT 제조자는 CUA가 항상 100% 신뢰할 수 있다고 기대하지 않습니다. OpenAI의 지원 문서도 이점을 인정하며, "Operator는 많은 복잡한 또는 전문적인 작업을 신뢰할 수 없다고 말합니다." 일부 예로는 "자세한 슬라이드 쇼를 만드는 것, 복잡한 캘린더 시스템 관리, 또는 고도로 사용자 지정이나 표준 웹 인터페이스와의 상호작용"이 있습니다. Operator에는 특정 작업에 대한 속도 제한과 전체적인 사용량 제한(하루에 초기화됨) 등 다른 단점이 있습니다. 또한 CAPTCHA 도전을 해결하는 것처럼 일부 작업에서 실패할 수 있으며, 복잡한 웹 인터페이스를 탐색하는 데 어려움을 겪습니다.

오퍼레이터는 미국의 ChatGPT 프로 구독자에게 최고가의 $200/월 ChatGPT Pro 계획을 통해 연구 프리뷰로 현재 사용 가능합니다. 플러스, 팀 및 기업 계층의 사용자는 오픈AI가 오퍼레이터를 이러한 계층으로 확장하는 데 시간이 걸릴 것을 기다려야 합니다. 이 기능은 "가까운 시일" 내에 추가 언어와 국가로 확장될 예정입니다. 코미디언 샘 알타민은 "유럽에는 조금 더 오래 걸릴 것이라고" 했습니다.

OpenAI는 이전에 ChatGPT에서 단순한 자동화 기능을 구현했으나 Operator가 첫 번째 AI 에이전트의 시도입니다. Rivals인 Google은 2024년 11월 Project Mariner이라는 실험적인 Chrome 확장 프로그램으로 자체 AI 에이전트를 공개했습니다. 이 확장 프로그램은 웹 폼을 자동으로 채우고, 버튼을 클릭하고 마우스 포인터를 이동할 수 있습니다.

AI 에이전트는 인공지능 혁명의 다음 논리적 단계로 간주됩니다. 이러한 기술은 사용자가 직접 웹사이트와 상호작용하지 않고도 지시에 따라 웹을 사용할 수 있도록 약속하고 있습니다. 그러나 AI 에이전트의 현재 용도는 최선의 경우에도 의문스럽습니다. 실험 단계에 있으며, 신뢰성이 향상될 때까지 널리 사용되지 않을 것입니다.