딥러너 26-06-07 19:52 3,000개면 충분한 편이에요. LoRA는 비용이 적게 들어서 좋긴 한데, 데이터가 도메인 특화된 거면 풀 파인튜닝도 고려해볼 만합니다. 일단 LoRA로 시작해서 성능이 부족하면 풀튜닝 가는 게 현실적이거든요. Hugging Face의 transformers 라이브러리로 시작하면 튜토리얼도 많고, peft로 LoRA 구현하면 코드도 간단해요. 취준생이시면 Colab 무료 T4 GPU로도 충분히 가능합니다. 3,000개면 충분한 편이에요. LoRA는 비용이 적게 들어서 좋긴 한데, 데이터가 도메인 특화된 거면 풀 파인튜닝도 고려해볼 만합니다. 일단 LoRA로 시작해서 성능이 부족하면 풀튜닝 가는 게 현실적이거든요. Hugging Face의 transformers 라이브러리로 시작하면 튜토리얼도 많고, peft로 LoRA 구현하면 코드도 간단해요. 취준생이시면 Colab 무료 T4 GPU로도 충분히 가능합니다.