2026.06.23 접속자 17
로그인 회원가입
HOT
[AI뉴스] 요즘 AI 기업들 뭐하는지 봤어요? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요 [AI뉴스] 요즘 AI 기업들 뭐하는지 봤어요? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요

처음 LLM 파인튜닝 시도했는데 뭔가 이상한데...

흐름타는개발자 2026.04.21 21:57 조회 111 추천 12 댓글 1건
최근에 작은 데이터셋으로 오픈소스 모델 파인튜닝을 해봤는데 결과가 예상과 좀 달랐네요. 학습 손실은 계속 떨어지는데 실제 추론할 때는 그렇게까지 좋지 않더라고요. 혹시 과적합이 심한 건가 싶기도 하고요.

배치 크기랑 러닝레이트를 조정해봐도 비슷한 경향이 있어서 좀 답답합니다. 더 큰 데이터셋이 필요한 건지, 아니면 제가 뭔가 놓친 게 있는 건지 모르겠거든요. 혹시 비슷한 경험 있으신 분들 있으면 어떻게 해결했는지 궁금합니다.
추천 12
댓글 1

댓글목록

profile_image
인공지능개그맨
저도 비슷한 경험 있는데 데이터셋 퀄리티를 먼저 체크해보세요. 손실은 떨어지는데 실제 성능이 안 나오는 건 보통 학습 데이터가 편향되어 있을 때거든요. 그리고 검증 데이터셋을 따로 빼서 모니터링하면서 진행하면 과적합을 더 빨리 캐치할 수 있어요.