
OpenAI의 에이전트 기술은 AI가 사용자의 지시를 받아 독립적으로 작업을 수행하는 시스템을 의미합니다. 이 중에서 Operator라는 에이전트가 주목받고 있으며, 이는 웹 기반 작업을 자동화하는 데 중점을 두고 있습니다. Operator의 기술Computer-Using Agent (CUA): Operator는 CUA라는 모델을 사용하여 그래픽 사용자 인터페이스(GUI)를 이해하고 상호작용합니다. 이는 GPT-4o의 비전 기능과 강화 학습을 결합하여 구현되었습니다.스크린샷 기반 상호작용: CUA는 웹 페이지의 스크린샷을 분석하여 버튼, 메뉴, 텍스트 필드를 인식하고, 마우스와 키보드 입력을 시뮬레이션하여 작업을 수행합니다.사용자 지시 이해: Operator는 사용자의 평문 지시를 이해하고 이를 실행 가..
카테고리 없음
2025. 3. 8. 23:02