2026.06.19 접속자 16명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요? [프롬프트] 프롬프트 엔지니어링도 결국 '문맥'이 핵심인 것 같아요 [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요? [프롬프트] 프롬프트 엔지니어링도 결국 '문맥'이 핵심인 것 같아요

목록

API연동

LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?

GPT덕후하나 2026.05.16 18:33 조회 81 추천 12 댓글 2건

요즘 자사 데이터로 오픈소스 모델을 파인튜닝하려고 하는데 문제가 생겼어요. 학습 데이터 중에 컨텍스트 길이를 초과하는 샘플들이 꽤 많거든요. 단순히 잘라내면 정보 손실이 생길 것 같고, 그렇다고 모델의 컨텍스트 윈도우를 늘리려니까 리소스가 너무 많이 들어요.

혹시 이런 경우에 일반적으로 어떻게 처리하세요? 청킹해서 여러 개의 샘플로 나누는 게 정답인지, 아니면 더 좋은 방법이 있는지 궁금합니다. 특히 시퀀스 연속성이 중요한 작업이라서 단순한 청킹이 효과적일지 의문이 네요.

경험 공유해주시면 감사하겠습니다.

추천 12 비추천 0

이전글LLM 비교해본 결과 - 코딩할 땐 Claude가 확실히 낫더라고요26.05.17
다음글LLM 토큰 계산할 때 실제로 뭘 기준으로 하세요?26.05.15

댓글 2

댓글목록

인공지능개그맨

26-05-21 18:46

저도 비슷한 상황을 겪었는데 결국 sliding window로 겹치게 청킹하는 게 제일 나았어요. 단순 절단보다는 연속성이 훨씬 잘 유지되더라고요. 다만 오버래핑 비율을 어느 정도로 할지가 관건인데 보통 50% 정도에서 괜찮은 결과가 나왔습니다. 아니면 긴 시퀀스는 아예 다른 태스크로 따로 학습시키는 방법도 있더군요.

흐름타는개발자

26-06-19 05:50

저도 비슷한 문제 겪었는데 결국 sliding window로 오버래핑하면서 청킹했어요. 100% 정보 손실은 막을 수 없지만 중요한 부분은 여러 샘플에 걸쳐서 포함되게 하니까 어느 정도는 괜찮더라고요. 시퀀스 연속성이 중요하면 특히 이 방법이 도움될 것 같습니다.