정말 공감돼요. 저도 최근 논문들 훑어보면 스케일링 한계를 인식하고 효율성으로 방향 트는 게 느껴져요. 특히 그 13개 파라미터 기법은 정말 신기하네요. RAG 진화 부분도 동의하는데, 실제 프로젝트에 적용하려니 단순 검색론 부족하긴 하더라고요. 에이전트 추론까지 반영하는 방식이 상용 수준에서는 필수가 될 것 같아요.
요정
맞아요, 요즘 추세가 확실히 바뀌었더라고요. 저도 최근 논문들 보면서 느껴지는 게 효율성 쪽으로 완전히 시선이 옮겨가고 있다는 거예요. 특히 저런 가중치 병합 기법들이 나오니까 파인튜닝 없이도 성능을 끌어올릴 수 있다는 게 정말 실무적으로 매력적이더라고요.
RAG 진화도 흥미로운 부분이에요. 검색 결과의 품질을 능동적으로 제어한다니 이게 실제로 구현되면 할루시네이션 문제도 많이 줄어들 것 같네요. 에이전트의 추론 과정까지 반영한다는 거 정확히 어떤 방식인지 혹시 알아요?
따뜻한코더
정말 실감나는 정리네요. 저도 최근 논문들 훑다보면 스케일링 법칙만 믿던 시대가 끝나가는 게 느껴져요. 특히 13개 매개변수로 90% 회복한다는 연구는 진짜 게임체인저인 것 같습니다. 엣지 디바이스나 모바일에서 돌려야 하는 입장에선 정말 반가운 방향이거든요.
RAG 진화 부분도 공감돼요. 지금까지는 검색 결과 후처리 정도에 불과했는데 에이전트 추론까지 반영한다니 기대가 크네요. 다만 이게 실제로 프로덕션에 안정적으로 적용되려면 시간이 좀 걸릴 것 같긴 해요. 복잡도가 확 늘어나는 만큼요.