2026.04.25 접속자 10
로그인 회원가입
HOT
[프롬프트] Claude 프롬프트로 코드리뷰 받아보신 분 계신가요? [프롬프트] Claude 프롬프트로 코드 리뷰 자동화해보니 정말 쓸만하네요 [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 팁 공유합니다 [AI뉴스] 2026년 AI 업계 판 완전히 다시 짜지는군요... 큰 모델 하나 다는 시대 끝나는 중 [프롬프트] 코드 리뷰할 때 쓰는 프롬프트 공유해요 [기술 Q&A] RAG 구현할 때 임베딩 모델 선택 기준이 뭐예요? [프롬프트] LLM한테 코드 리뷰 받을 때 쓰는 프롬프트 공유 [AI뉴스] 한국이 세계 최초로 AI 규제 전면 시행... EU보다 먼저네요 [AI뉴스] 오픈AI가 GPT-6 내일 출시한다는데 성능이 진짜 대박이라네요 [AI뉴스] 이제 AI는 시켜야 할 걸 하는 에이전트 시대네요 [프롬프트] Claude 프롬프트로 코드리뷰 받아보신 분 계신가요? [프롬프트] Claude 프롬프트로 코드 리뷰 자동화해보니 정말 쓸만하네요 [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 팁 공유합니다 [AI뉴스] 2026년 AI 업계 판 완전히 다시 짜지는군요... 큰 모델 하나 다는 시대 끝나는 중 [프롬프트] 코드 리뷰할 때 쓰는 프롬프트 공유해요 [기술 Q&A] RAG 구현할 때 임베딩 모델 선택 기준이 뭐예요? [프롬프트] LLM한테 코드 리뷰 받을 때 쓰는 프롬프트 공유 [AI뉴스] 한국이 세계 최초로 AI 규제 전면 시행... EU보다 먼저네요 [AI뉴스] 오픈AI가 GPT-6 내일 출시한다는데 성능이 진짜 대박이라네요 [AI뉴스] 이제 AI는 시켜야 할 걸 하는 에이전트 시대네요
AI서비스

오픈AI가 GPT-6 내일 출시한다는데 성능이 진짜 대박이라네요

AI새싹 2026.04.22 17:00 조회 31 추천 13 댓글 1건
어제(4월 7일) 오픈AI가 공식 발표했는데 GPT-6(내부명 '스펀')이 4월 14일에 전 세계 출시된대요. 벤치마크 수치들을 보니까 진짜 미쳤어요.

코딩, 추론, 에이전트 작업 기준으로 GPT-5.4보다 40% 이상 성능이 올라갔다고 하는데, HumanEval 점수가 95%를 넘고 수학 추론은 85% 근처까지 간다고 하네요. 컨텍스트 윈도우도 200만 토큰으로 확대돼서 약 150만 단어 정도를 한 번에 처리할 수 있다고 합니다.

특별한 점은 '듀얼-티어 추론' 방식으로 빠른 응답과 정밀한 검증을 동시에 하는데, 이를 통해 할루시네이션을 0.1% 이하로 낮췄다고 해요. 이제 내일 직접 써볼 텐데, 진짜 체감이 다를지 궁금하네요. 혹시 누구 미리 써본 사람 있어요?
추천 13 비추천 0
댓글 1

댓글목록

profile_image
오늘도살자
잠깐, 이거 4월 7일 발표라고 했는데 지금이 언제죠? 혹시 낚시는 아닐까요 ㅋㅋ