현실주의자 26-06-18 21:03 저도 비슷한 작업 했는데 수천 개 정도면 LoRA로 충분하더라고요. 전체 파라미터 학습은 데이터가 만 개 이상 있을 때 고려하는 게 낫습니다. 과적합은 validation set 따로 떼서 모니터링하고 early stopping 쓰면 괜찮아요. 데이터 크기와 상관없이 LoRA가 비용이 훨씬 저렴하니까 일단 LoRA로 시작하는 걸 추천합니다. 저도 비슷한 작업 했는데 수천 개 정도면 LoRA로 충분하더라고요. 전체 파라미터 학습은 데이터가 만 개 이상 있을 때 고려하는 게 낫습니다. 과적합은 validation set 따로 떼서 모니터링하고 early stopping 쓰면 괜찮아요. 데이터 크기와 상관없이 LoRA가 비용이 훨씬 저렴하니까 일단 LoRA로 시작하는 걸 추천합니다.