![오픈AI 공식 유튜브 채널 캡처. ](http://www.dailyan.com/data/photos/20250102/art_17363854033427_b7e94f.jpg)
데일리연합 (SNSJTV. 아이타임즈M) 곽중희 기자 | 인공지능(AI) 분야의 선도 기업 오픈AI(대표 샘 알트먼)가 12월 20일(현지시간) 새로운 추론 모델 'o3'와 'o3-미니'를 공개했다. 이 모델은 인공일반지능(AGI)에 근접한 최초의 모델로 평가받고 있다.
오픈AI는 12일간의 발표 이벤트 '십마스(shipmas)'의 마지막 날에 이 모델들을 출시했다. 'o2'라는 이름을 사용하지 않은 이유는 영국 통신사와의 혼동을 피하기 위해서라고 밝혔다.
샘 알트먼 CEO는 "이 모델을 통해 복잡한 작업을 수행할 수 있는 AI의 새로운 시대가 시작되었다"고 언급했다. 또한, o3의 성능을 입증하기 위해 다양한 벤치마크 테스트를 실시했다.
특히, ARC 프라이즈 파운데이션의 그렉 캄라트 회장은 'ARC-AGI' 벤치마크를 통해 o3가 이전 모델인 o1의 최고 점수 32점을 크게 넘어 75.7점을 기록했다고 발표했다. 추론 시간을 늘리면 최대 87.5점까지 도달하여, 이는 인간의 평균 점수인 85점을 초과하는 성과다.
프랑수아 콜레 ARC 프라이즈 파운데이션 공동 창립자는 "o3의 출시는 AI 역량의 중요한 도약이며, 이제 AI 성능 기준은 o3에 맞춰야 한다"고 평가했다.
오픈AI의 자체 벤치마크에서도 o3는 소프트웨어 작업 평가에서 71.7%의 정확도를 기록하며, 이전 모델보다 20% 이상 향상된 성과를 보였다. 또한, 코딩 능력 평가에서는 2727점을 받아, 오픈AI 수석과학자의 최고 점수인 2500점을 넘었다.
수학과 과학 분야에서도 o3는 이전 모델을 능가하며, 박사 학위 소지자의 성적을 뛰어넘는 결과를 보였다.
오픈AI는 o3의 추론 시간 조정 기능을 통해 컴퓨팅 설정을 조절할 수 있으며, 비용 효율성을 고려해 'o3-미니'를 함께 출시했다. o3-미니는 1월 10일까지 레드팀 테스트를 위한 대기자 리스트를 모집하며, 1월 말부터 테스트를 시작할 예정이다.
이번 발표는 구글이 새로운 추론 모델 '제미나이 2.0 플래시 띵킹'을 공개한 다음 날 이루어졌다. 오픈AI는 AGI에 근접한 모델을 발표하며 AI 분야에서의 경쟁에서 한 발 앞서 나가는 모습을 보였다.