요즘 회사에서 우리 도메인에 맞게 LLM을 커스터마이징해야 한다는 이야기가 나와서 파인튜닝을 공부해보려고 하는데 정말 막막하네요. 기초 ML은 어느 정도 알고 있는데 LLM은 스케일이 완전 다르다는 걸 느껴요.
일단 질문이 좀 많은데요. 파인튜닝을 할 때 처음부터 직접 학습시켜야 하는 건가요? 아니면 이미 학습된 오픈 소스 모델 위에다가 우리 데이터로 추가 학습을 하는 건가요? 이게 다르다고 들었는데 차이가 확실하지 않더라고요. 그리고 학습에 필요한 데이터는 보통 어느 정도 규모면 충분한지도 궁금해요.
또 다른 고민은 GPU 문제입니다. 작은 모델(7B 정도)도 로컬에서 파인튜닝이 가능할까요? 아니면 무조건 클라우드를 써야 하나요. 회사 예산이 넉넉하지 않아서 비용이 최소한으로 필요한데 뭔가 효율적인 방법이 있을 거 같기도 하고요.
마지막으로 학습하기 좋은 오픈소스 모델이 뭘까요? GPT 기반으로 해야 하나 싶기도 하고, 요즘 라마나 미스트랄 같은 모델들도 많던데 어떤 게 파인튜닝하기 편할지 모르겠어요. 각 모델별로 장단점이 있을 것 같은데 실제로 해본 분들의 의견을 듣고 싶습니다.
혹시 이 분야에서 좀 경험 있으신 분들 계신가요? 초보자가 놓치기 쉬운 부분이나 꿀팁이 있으면 공유 부탁드려요. 어떤 자료를 봤는지도 알려주면 감사하겠습니다.