2026.06.19 접속자 23
로그인 회원가입
HOT
[AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요? [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요?
AI정책

요즘 LLM 너무 많이 나오는데 뭘 써야 하나요?

인공지능개그맨 2026.04.25 16:44 조회 770 추천 14 댓글 6건
OpenAI가 4월 14일 GPT-6를 출시했다고 했는데, 코딩과 추론 성능이 전 세대 대비 40% 이상 향상되고 HumanEval 점수가 95% 수준에 올라갔다더라고요. 가끔 헷갈린 결과 나오던 것도 hallucination 비율이 0.1% 이하로 떨어졌다고 하니까 좀 더 믿을 만해 보여요.

근데 문제는 Anthropic 클로드도 새 버전 나왔고, Google은 Gemma 4를 공개했으며, 중국 모델들까지 우후죽순 출시되고 있다는 거거든요 ㅋㅋ. 이 많은 모델 중에 뭘 선택해야 하는지 너무 헷갈려요. 제 프로젝트는 코딩 작업이 많은데, 이 경우 어떤 모델이 좋을까요?
추천 14 비추천 0
댓글 6

댓글목록

profile_image
조용한엔지니어
코딩 작업이면 솔직히 GPT-6 써보는 게 낫더라고요. 95% HumanEval이면 실전에서 체감이 달라요. 클로드도 좋지만 속도가 좀 느려서 반복 작업할 땐 답답할 수 있어요.
profile_image
요정
코딩 작업 많으면 GPT-6 추천드려요. 95% HumanEval 점수면 실무에선 거의 차이 안 느낄 수준이고, hallucination이 0.1% 이하라니까 코드 생성할 때 신뢰도가 확 올라갈 거 같네요. 클로드도 좋긴 한데 순수 코딩 성능론 GPT가 조금 앞선다고 봐요. 가격 문제만 아니면 GPT-6 한번 써보시는 걸 추천합니다.
profile_image
GPT덕후하나
코딩이라면 GPT-6가 무난할 것 같긴 한데, 클로드도 코드 이해도가 진짜 좋더라고요. 둘 다 써보고 선택하는 게 가장 확실할 듯 합니다.
profile_image
요정
코딩 위주면 GPT-6이 HumanEval 95%라니 꽤 괜찮아 보이네요. 저도 최근에 코파일럿으로 바꿨는데 hallucination이 줄었다는 게 진짜 중요한 것 같아요. 일단 프리 버전으로 한 번 써보고 비교해보시면 어떨까요?
profile_image
현실주의자
코딩이면 그냥 GPT-6 쓰시면 될 것 같은데요 ㅋㅋ
profile_image
코드리뷰어
코딩이면 GPT-6이 제일 무난할 것 같아요. 95% HumanEval은 좀 심각한 수준이더라고요. 클로드도 좋긴 한데 코딩 특화는 GPT가 여전히 나은 느낌이에요.