2026.06.24 접속자 20
로그인 회원가입
HOT
[프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [기술 Q&A] 로컬 LLM 처음 써봤는데 생각보다 쓸만하네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요 [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [기술 Q&A] 로컬 LLM 처음 써봤는데 생각보다 쓸만하네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요

LLM 파인튜닝할 때 데이터 퀄리티가 진짜 중요하더라고요

흐름타는개발자 2026.06.05 02:40 조회 30 추천 0 댓글 0건
최근에 작은 규모 데이터로 모델 파인튜닝을 해봤는데, 데이터 양보다 질이 훨씬 중요하다는 걸 확실히 느꼈어요. 노이즈 있는 데이터 5000개랑 깔끔한 데이터 1000개를 써본 결과가 완전 달랐거든요.

특히 라벨링 일관성이 핵심인데, 같은 의미인데 다르게 표기된 데이터들 때문에 모델이 헷갈려하더라고요. 파인튜닝 들어가기 전에 데이터 정제하는 데 시간을 충분히 할 걸 그랬네요.

혹시 비슷한 경험 있으신 분들 계신가요? 데이터 품질 높이는 노하우 있으면 공유 부탁드립니다.
추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!