2026.07.05 접속자 14
로그인 회원가입
HOT
[AI뉴스] 메타가 AI 스마트안경, SK도 미국 AI 투자 100억달러... 요즘 AI 기업들 진짜 미친 수준이네요 [자유게시판] 편의점 야식 먹다가 깨달은 거 있어요 [AI뉴스] 오픈소스 AI 모델들이 드디어 따라잡기 시작했다더라고요. 실용성은? [AI뉴스] 올해 AI 쓰는 사람들 점점 많아지네요... 한국도 세계에서 가장 빠르게 증가 중 [자유게시판] 요즘 날씨 때문에 옷장 정리하다가 깨달은 거 [자유게시판] 직장 동료랑 점심 먹을 때 대화 뭐 하세요? [프롬프트] 코드 리뷰할 때 쓰는 프롬프트 공유합니다 [프롬프트] 데이터 분석 프롬프트 정리하면서 배운 것들 공유합니다 [자유게시판] 요즘 월급 받아도 기분이 안 올라가는 거 나만인가요 [프롬프트] 업무 자동화 프롬프트 공유 - 엑셀 데이터 정리하는 거 이렇게 하니까 훨씬 빨라요 [AI뉴스] 메타가 AI 스마트안경, SK도 미국 AI 투자 100억달러... 요즘 AI 기업들 진짜 미친 수준이네요 [자유게시판] 편의점 야식 먹다가 깨달은 거 있어요 [AI뉴스] 오픈소스 AI 모델들이 드디어 따라잡기 시작했다더라고요. 실용성은? [AI뉴스] 올해 AI 쓰는 사람들 점점 많아지네요... 한국도 세계에서 가장 빠르게 증가 중 [자유게시판] 요즘 날씨 때문에 옷장 정리하다가 깨달은 거 [자유게시판] 직장 동료랑 점심 먹을 때 대화 뭐 하세요? [프롬프트] 코드 리뷰할 때 쓰는 프롬프트 공유합니다 [프롬프트] 데이터 분석 프롬프트 정리하면서 배운 것들 공유합니다 [자유게시판] 요즘 월급 받아도 기분이 안 올라가는 거 나만인가요 [프롬프트] 업무 자동화 프롬프트 공유 - 엑셀 데이터 정리하는 거 이렇게 하니까 훨씬 빨라요
API연동

LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?

GPT덕후하나 2026.07.01 20:11 조회 13 추천 2 댓글 0건
요즘 자체 데이터로 LLM 파인튜닝을 시도하고 있는데, 학습 데이터 중에 토큰 길이가 4096을 넘는 샘플들이 꽤 많아요. 단순히 자르기만 하면 정보 손실이 심할 것 같은데 다들 어떻게 처리하시나요?

지금 생각하는 방법은 긴 문맥을 청킹해서 별도로 처리하거나, 아니면 그냥 max_length 설정해서 자르는 건데, 둘 다 좀 찝찝하네요. 혹시 더 좋은 방법이 있으면 알려주세요.

참고로 Llama 2 기반으로 작업 중이고 가용 VRAM이 24GB 정도입니다.
추천 2 비추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!