/ ChatGPT는 더 나은 연구보조자로 발전하기 위해 노력합니다.

ChatGPT는 더 나은 연구보조자로 발전하기 위해 노력합니다.

2025. 2. 4. 오전 3:03:14
ChatGPT가 단순 챗봇을 넘어 심층 연구 도구로 진화했습니다. 새로운 "심층 연구" 기능은 Pro 계정에서만 이용 가능하며, ChatGPT가 텍스트, 이미지, PDF 등 다양한 자료를 기반으로 독립적인 연구를 수행하여 자세하고 출처가 있는 요약을 제공합니다. OpenAI는 이 기능이 Google Gemini와 비슷하지만, 전문가 수준의 성능과 "인류의 마지막 시험"에 맞춘 높은 정확도를 자랑하며, 향후 이미지 및 차트 포함 등 더 발전된 기능 추가를 계획하고 있습니다.
ChatGPT는 더 나은 연구보조자로 발전하기 위해 노력합니다.

운영자를 출시하면서 ChatGPT는 현재 상태가 좋지는 않지만 단순한 챗봇을 넘어섰습니다. 오픈AI는 같은 방향으로 나아가고 있으며 최근 추가된 기능은 심층 연구를 수행할 수 있는 도구입니다. 이는 완전히 새로운 개념이 아니며, 오픈AI는 자신만의 이점이 있다고 주장하는 몇 가지 이유가 있습니다.

ChatGPT는 새로운 도구인 "심층 연구"를 추가했습니다. 이 새로운 기능은 현재 가장 비싼 Pro 계정에서만 사용 가능하며, ChatGPT가 단순한 텍스트 생성을 넘어 독립적인 연구 보조자가 되도록 하여 여러 단계의 연구 과정을 계획하고 실행하여 정보를 수집하고 자세하고 출처가 있는 요약을 제공할 수 있게 합니다.

사용자는 텍스트, 이미지를 사용하여 질문을 하고 PDF나 스프레드시트와 같은 문서를 업로드할 수도 있습니다. 그 후에는 심층적인 연구가 진행되어 정보를 꼼꼼하게 분석하고 필요하면 되돌아가며 실시간 데이터에 반응하며 답변을 만들기 위해 5에서 30분까지 소요됩니다. 결과는 요약과 참고문헌이 사이드바에 표시된 채 채팅 창에 제시됩니다. OpenAI는 이 도구의 미래 버전이 이미지와 차트를 답변 내부에 삽입할 수도 있다고 주장하며 현재는 텍스트만 제공되고 있습니다.

이것은 완전히 새로운 개념은 아닙니다. 구글의 제미니는 이미 "심층 연구"라는 기능을 가지고 있으며 비슷한 방식으로 작동합니다. 여러 출처를 검색하고 몇 분 동안 정보를 종합하여 자세한 보고서/기사를 작성하는 데 사용됩니다. 저는 여러 번 시도해 보았으며, 잘 작동하며 상당히 정교함을 발견했습니다. 사용자 리뷰를 살펴보고 여러 웹사이트(때로는 How-To Geek까지)를 참조하고 YouTube 동영상을 보고 찾은 데이터를 비교하여 하나의 보고서에 요약하는 다단계 연구 과정을 수행합니다. 게다가 Google Gemini Advanced 구독과 함께 이용 가능하며, 월 20달러라는 가격이 ChatGPT Pro의 월 200달러에 비해 합리적입니다.

오픈에이이가 이와 같은 기능을 출시하는 데 기술적으로 늦었다는 것을 알고 있으며, 다른 챗봇 대신 이를 사용해야 하는 이유를 몇 가지 제시합니다. 오픈에이는 단순한 웹사이트 모음집이 아닌, 연구 분석가 수준의 성능을 제공하기 위해 설계된 심층 연구 기능이라고 말합니다. 회사에서 공개한 데모 영상은 지난 3년간 소매 산업 변화를 분석하는 도구의 능력을 보여주며, 구체적인 사항과 표를 포함한 응답을 생성합니다. 이 심층 연구 기능은 오픈에이의 추론 모델을 사용하며, 제미니는 일반적인 제미니 1.5 Pro(곧 제미니 2.0 Pro로 변경될 것으로 예상)를 사용합니다.

OpenAI는 "인류의 마지막 시험"이라는 기준을 사용하여 심층 연구 기능의 성능을 강조하고 있습니다. 이 기능은 검색 및 파이썬 도구를 갖추고 있을 때 전문가 수준 질문에서 26.6%의 정확도를 달성했습니다. 이는 GPT-4o와 같은 다른 모델들보다 훨씬 우수한 성능이며, GPT-4o는 동일한 시험에서 3%의 정확도를 기록했습니다. OpenAI는 이 기능이 아직 초기 단계에 있지만, 시간이 지남에 따라 더욱 향상될 것이라고 주장합니다.

OpenAI는 이 기능의 초기 버전은 문제가 발생할 수 있다고 언급하고 있습니다. 사실을 捏造하는 (hallucinations) 가능성, 권위 있는 정보와 루머를 구분하기 어려움, 그리고 자신의 응답에 대한 확신도를 평가하는 데 어려움이 포함됩니다. 이는 아직까지 완전히 해결하지 못한 AI의 일반적인 문제이며, 시간이 지남에 따라 개선될 가능성이 높습니다. 그러나 이 기능을 사용한다면 출력 내용이 정확한지 확인해 보는 것이 좋습니다.