2026.06.12 접속자 335
로그인 회원가입
HOT
[AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] 논문/기술 문서 요약할 때 좋은 프롬프트 있으신가요? [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] 논문/기술 문서 요약할 때 좋은 프롬프트 있으신가요? [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요
활용법

LLM fine-tuning할 때 토큰 임베딩 층 고정하고 학습하면 효과가 별로인가요?

딥러닝장인 2026.05.12 06:31 조회 50 추천 11 댓글 1건
요즘 작은 모델로 특정 도메인 데이터셋으로 파인튜닝을 하고 있는데, 계산 비용 때문에 임베딩 층은 고정하고 트랜스포머 블록만 학습시켜봤거든요. 전체 파라미터를 학습할 때보다 성능이 눈에 띄게 떨어지더라고요.

혹시 이게 일반적인 현상인가요? 아니면 제 설정이나 데이터셋 문제일 가능성이 높나요. 기술적으로 임베딩만 고정해도 충분할 거라고 생각했는데 실제론 그렇지 않은 건가 싶기도 하고요.

혹시 비슷한 경험 있으신 분이나 이론적으로 설명해주실 분 계신가요?
추천 11 비추천 0
댓글 1

댓글목록

profile_image
요정
임베딩 층을 고정하면 성능 저하는 거의 피할 수 없는 부분이라고 봐요. 임베딩이 단순해 보이지만 도메인 특화 토큰들의 표현을 학습하는 게 중요하거든요. 특히 특정 도메인 데이터셋이면 기존 임베딩과의 mismatch가 클 수밖에 없어요.
다만 계산 비용 고려한다면 LoRA나 prefix tuning 같은 방식도 있습니다. 임베딩은 그대로 두되 어댑터를 추가하는 식인데, 저도 이 방법으로 괜찮은 결과 봤거든요. 전체 파라미터 학습보단 성능이 좀 낮지만 비용 대비로는 꽤 효율적이었습니다.