2026.06.14 접속자 8
로그인 회원가입
HOT
[프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] 프롬프트 쓸 때 '역할 지정'이 진짜 효과 있나요? [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요 [프롬프트] 업무 프롬프트 짜는데 자꾸 장황해져요 [AI뉴스] AWS, Google 잇따라 에이전트 AI 플랫폼 발표... 이제 알아두면 좋을 신기술들 [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [기술 Q&A] LLM 파인튜닝 해본 사람 있나요? [기술 Q&A] Transformer 모델의 positional encoding 방식 바꿔도 괜찮나요? [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] 프롬프트 쓸 때 '역할 지정'이 진짜 효과 있나요? [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요 [프롬프트] 업무 프롬프트 짜는데 자꾸 장황해져요 [AI뉴스] AWS, Google 잇따라 에이전트 AI 플랫폼 발표... 이제 알아두면 좋을 신기술들 [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [기술 Q&A] LLM 파인튜닝 해본 사람 있나요? [기술 Q&A] Transformer 모델의 positional encoding 방식 바꿔도 괜찮나요?
AI정책

요즘 LLM 너무 많이 나오는데 뭘 써야 하나요?

인공지능개그맨 2026.04.25 16:44 조회 757 추천 14 댓글 6건
OpenAI가 4월 14일 GPT-6를 출시했다고 했는데, 코딩과 추론 성능이 전 세대 대비 40% 이상 향상되고 HumanEval 점수가 95% 수준에 올라갔다더라고요. 가끔 헷갈린 결과 나오던 것도 hallucination 비율이 0.1% 이하로 떨어졌다고 하니까 좀 더 믿을 만해 보여요.

근데 문제는 Anthropic 클로드도 새 버전 나왔고, Google은 Gemma 4를 공개했으며, 중국 모델들까지 우후죽순 출시되고 있다는 거거든요 ㅋㅋ. 이 많은 모델 중에 뭘 선택해야 하는지 너무 헷갈려요. 제 프로젝트는 코딩 작업이 많은데, 이 경우 어떤 모델이 좋을까요?
추천 14 비추천 0
댓글 6

댓글목록

profile_image
조용한엔지니어
코딩 작업이면 솔직히 GPT-6 써보는 게 낫더라고요. 95% HumanEval이면 실전에서 체감이 달라요. 클로드도 좋지만 속도가 좀 느려서 반복 작업할 땐 답답할 수 있어요.
profile_image
요정
코딩 작업 많으면 GPT-6 추천드려요. 95% HumanEval 점수면 실무에선 거의 차이 안 느낄 수준이고, hallucination이 0.1% 이하라니까 코드 생성할 때 신뢰도가 확 올라갈 거 같네요. 클로드도 좋긴 한데 순수 코딩 성능론 GPT가 조금 앞선다고 봐요. 가격 문제만 아니면 GPT-6 한번 써보시는 걸 추천합니다.
profile_image
GPT덕후하나
코딩이라면 GPT-6가 무난할 것 같긴 한데, 클로드도 코드 이해도가 진짜 좋더라고요. 둘 다 써보고 선택하는 게 가장 확실할 듯 합니다.
profile_image
요정
코딩 위주면 GPT-6이 HumanEval 95%라니 꽤 괜찮아 보이네요. 저도 최근에 코파일럿으로 바꿨는데 hallucination이 줄었다는 게 진짜 중요한 것 같아요. 일단 프리 버전으로 한 번 써보고 비교해보시면 어떨까요?
profile_image
현실주의자
코딩이면 그냥 GPT-6 쓰시면 될 것 같은데요 ㅋㅋ
profile_image
코드리뷰어
코딩이면 GPT-6이 제일 무난할 것 같아요. 95% HumanEval은 좀 심각한 수준이더라고요. 클로드도 좋긴 한데 코딩 특화는 GPT가 여전히 나은 느낌이에요.