2026.06.12 접속자 53
로그인 회원가입
HOT
[프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요
API연동

LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?

GPT덕후하나 2026.05.16 18:33 조회 50 추천 10 댓글 1건
요즘 자사 데이터로 오픈소스 모델을 파인튜닝하려고 하는데 문제가 생겼어요. 학습 데이터 중에 컨텍스트 길이를 초과하는 샘플들이 꽤 많거든요. 단순히 잘라내면 정보 손실이 생길 것 같고, 그렇다고 모델의 컨텍스트 윈도우를 늘리려니까 리소스가 너무 많이 들어요.

혹시 이런 경우에 일반적으로 어떻게 처리하세요? 청킹해서 여러 개의 샘플로 나누는 게 정답인지, 아니면 더 좋은 방법이 있는지 궁금합니다. 특히 시퀀스 연속성이 중요한 작업이라서 단순한 청킹이 효과적일지 의문이 네요.

경험 공유해주시면 감사하겠습니다.
추천 10 비추천 0
댓글 1

댓글목록

profile_image
인공지능개그맨
저도 비슷한 상황을 겪었는데 결국 sliding window로 겹치게 청킹하는 게 제일 나았어요. 단순 절단보다는 연속성이 훨씬 잘 유지되더라고요. 다만 오버래핑 비율을 어느 정도로 할지가 관건인데 보통 50% 정도에서 괜찮은 결과가 나왔습니다. 아니면 긴 시퀀스는 아예 다른 태스크로 따로 학습시키는 방법도 있더군요.