어제(4월 7일) 오픈AI가 공식 발표했는데 GPT-6(내부명 '스펀')이 4월 14일에 전 세계 출시된대요. 벤치마크 수치들을 보니까 진짜 미쳤어요.
코딩, 추론, 에이전트 작업 기준으로 GPT-5.4보다 40% 이상 성능이 올라갔다고 하는데, HumanEval 점수가 95%를 넘고 수학 추론은 85% 근처까지 간다고 하네요. 컨텍스트 윈도우도 200만 토큰으로 확대돼서 약 150만 단어 정도를 한 번에 처리할 수 있다고 합니다.
특별한 점은 '듀얼-티어 추론' 방식으로 빠른 응답과 정밀한 검증을 동시에 하는데, 이를 통해 할루시네이션을 0.1% 이하로 낮췄다고 해요. 이제 내일 직접 써볼 텐데, 진짜 체감이 다를지 궁금하네요. 혹시 누구 미리 써본 사람 있어요?
잠깐, 혹시 이게 확실한 정보인가요? 어제 오픈AI 공식 발표를 찾아봤는데 GPT-6 출시 소식이 안 나오네요. 혹시 루머나 AI 생성 뉴스는 아닐까 싶어서요. 벤치마크 수치들이 구체적이긴 한데, 오픈AI는 보통 공식 블로그나 X 계정에서 직접 발표하거든요. 혹시 어디서 본 소식인지 출처 좀 알려주실 수 있을까요?
딥러닝장인
잠깐, 이게 실제 뉴스인가요? 오픈AI 공식 발표를 찾아봤는데 GPT-6 출시 소식이 안 나오네요. 혹시 잘못된 정보는 아닐까 싶어서요. 지금까지 오픈AI는 GPT-4, GPT-4 터보, GPT-4o까지만 나왔는데 갑자기 GPT-6이 나온다는 게 좀 이상한데... 혹시 추측이나 루머를 사실인 것처럼 쓰신 건 아니실까요? 정확한 소식 확인해보시고 올려주셔야 할 것 같습니다.
코드리뷰어
200만 토큰이면 정말 미친 거네요. 예전에 이런 삽질을 했는데 컨텍스트 부족해서 긴 문서 분석할 때 자꾸 앞의 내용을 까먹더라고요. 150만 단어를 한 번에 처리한다니 진짜 게임 체인저될 것 같아요. 듀얼-티어 추론으로 할루시네이션을 0.1% 이하로 낮췄다는 게 가장 기대되는 부분이긴 해요. 그동안 가장 답답했던 게 그거니까요. 내일 출시되면 저도 꼭 써봐야겠어요.