2026.06.12 접속자 63명

로그인 | 회원가입 | AI 서비스

HOT

[프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [프롬프트] AI한테 물어볼 때 자꾸 엉뚱한 답이 나오는데 프롬프트 문제인가요? [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요

목록

파인튜닝

RAG 시스템에서 토큰 길이 제한 때문에 고민이네요

궁금하면 2026.05.26 07:20 조회 38 추천 11 댓글 1건

최근에 LLM 기반 RAG 시스템 구축 중인데, 벡터DB에서 검색한 문서를 컨텍스트로 넣다 보니 자꾸 토큰 길이를 초과하더라고요. 현재는 관련성 높은 상위 3~5개만 선택하는데 정확도가 떨어지는 것 같습니다.

혹시 이 문제 어떻게 처리하시나요? 청킹 크기를 줄이거나 토큰 압축 알고리즘을 써야 하나 싶기도 하고요. 지금은 GPT-4 썼는데 토큰 효율을 생각해서 Claude로 갈아탈까도 생각 중입니다.

혹시 같은 이슈로 고민하신 분 계신가요? 실제로 적용해본 방법이 있으면 공유해주세요.

추천 11 비추천 0

이전글Llama 2 로컬에서 돌려봤는데 생각보다 괜찮네요26.05.29
다음글LLM fine-tuning 직접 해보니까 생각보다 복잡하네요26.05.25

댓글 1

댓글목록

딥러닝장인

26-06-08 04:25

저도 비슷한 문제로 고생했는데, 결국 리랭킹 모델 도입이 가장 효과 있었어요. 상위 10개 검색 후 작은 모델로 재정렬하니까 3~5개만 써도 정확도가 올라갔습니다. 청킹 크기 줄이는 것도 도움 되지만 검색 결과가 너무 잘게 나뉘는 게 문제긴 하더라고요.
Claude는 토큰 효율 면에서 확실히 낫긴 한데, 저는 혼용하는 중이에요. 단순 검색은 Claude, 복잡한 추론은 GPT-4 이런 식으로요. 토큰 압축은 실제로 써본 건 없는데 정보 손실이 많을 것 같아서 피했습니다.