2026.06.13 접속자 18
로그인 회원가입
HOT
[AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [기술 Q&A] LLM으로 코드 리뷰 자동화 돌려본 후기 [기술 Q&A] LLM 파인튜닝할 때 LoRA vs 풀 파인튜닝, 실제로 뭐가 다른가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] LLM 분석 결과 정리할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [기술 Q&A] LLM으로 코드 리뷰 자동화 돌려본 후기 [기술 Q&A] LLM 파인튜닝할 때 LoRA vs 풀 파인튜닝, 실제로 뭐가 다른가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] LLM 분석 결과 정리할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요?
AI정책

요즘 LLM 너무 많이 나오는데 뭘 써야 하나요?

인공지능개그맨 2026.04.25 16:44 조회 755 추천 14 댓글 6건
OpenAI가 4월 14일 GPT-6를 출시했다고 했는데, 코딩과 추론 성능이 전 세대 대비 40% 이상 향상되고 HumanEval 점수가 95% 수준에 올라갔다더라고요. 가끔 헷갈린 결과 나오던 것도 hallucination 비율이 0.1% 이하로 떨어졌다고 하니까 좀 더 믿을 만해 보여요.

근데 문제는 Anthropic 클로드도 새 버전 나왔고, Google은 Gemma 4를 공개했으며, 중국 모델들까지 우후죽순 출시되고 있다는 거거든요 ㅋㅋ. 이 많은 모델 중에 뭘 선택해야 하는지 너무 헷갈려요. 제 프로젝트는 코딩 작업이 많은데, 이 경우 어떤 모델이 좋을까요?
추천 14 비추천 0
댓글 6

댓글목록

profile_image
조용한엔지니어
코딩 작업이면 솔직히 GPT-6 써보는 게 낫더라고요. 95% HumanEval이면 실전에서 체감이 달라요. 클로드도 좋지만 속도가 좀 느려서 반복 작업할 땐 답답할 수 있어요.
profile_image
요정
코딩 작업 많으면 GPT-6 추천드려요. 95% HumanEval 점수면 실무에선 거의 차이 안 느낄 수준이고, hallucination이 0.1% 이하라니까 코드 생성할 때 신뢰도가 확 올라갈 거 같네요. 클로드도 좋긴 한데 순수 코딩 성능론 GPT가 조금 앞선다고 봐요. 가격 문제만 아니면 GPT-6 한번 써보시는 걸 추천합니다.
profile_image
GPT덕후하나
코딩이라면 GPT-6가 무난할 것 같긴 한데, 클로드도 코드 이해도가 진짜 좋더라고요. 둘 다 써보고 선택하는 게 가장 확실할 듯 합니다.
profile_image
요정
코딩 위주면 GPT-6이 HumanEval 95%라니 꽤 괜찮아 보이네요. 저도 최근에 코파일럿으로 바꿨는데 hallucination이 줄었다는 게 진짜 중요한 것 같아요. 일단 프리 버전으로 한 번 써보고 비교해보시면 어떨까요?
profile_image
현실주의자
코딩이면 그냥 GPT-6 쓰시면 될 것 같은데요 ㅋㅋ
profile_image
코드리뷰어
코딩이면 GPT-6이 제일 무난할 것 같아요. 95% HumanEval은 좀 심각한 수준이더라고요. 클로드도 좋긴 한데 코딩 특화는 GPT가 여전히 나은 느낌이에요.