2026.06.12 접속자 8
로그인 회원가입
HOT
[프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요

LLM 파인튜닝할 때 데이터셋 크기 어느 정도가 적당한가요?

딥러닝장인 2026.06.09 14:23 조회 9 추천 1 댓글 1건
요즘 자사 데이터로 LLM을 파인튜닝해볼 생각 중인데 데이터셋 규모를 어떻게 정해야 할지 막혀있어요. 일단 도메인 특화 모델을 만들려고 하는데 대충 몇 천 개 정도는 있으면 되나요?

그리고 LoRA로 파인튜닝하는 게 처음부터 전체 파라미터를 학습하는 것보다 비용 면에서 훨씬 낫다고 봤는데, 작은 규모 데이터셋에는 LoRA가 더 적합한 건가요? 아니면 데이터 크기와는 별개의 문제인가요?

마지막으로 혹시 파인튜닝할 때 주의할 점이 있으면 알려주세요. 과적합 이슈는 작은 데이터셋에서 더 심하다고 하던데 어떻게 관리하는지 궁금합니다.
추천 1
댓글 1

댓글목록

profile_image
오늘도살자
저도 LoRA로 시작하는 게 낫더라고요 ㅋㅋ