요즘 AI 이야기할 때 자꾸 LLM이라고 하는데, 처음엔 뭐 하는 건지 몰라서 좀 찾아봤거든요. 그래서 정리한 걸 공유해볼게요.
LLM은 Large Language Model의 약자인데, 쉽게 말해서 엄청 큰 언어 모델이라는 뜻입니다. 챗지피티, 클로드, 제미나이 같은 거들이 다 LLM이거든요. 이런 모델들은 기본적으로 다음 단어가 뭘 올지 예측하는 방식으로 학습되어 있어요. 그래서 당신이 질문을 하면 그에 맞는 단어들을 하나하나 생성해서 답변을 만드는 거죠.
여기서 중요한 게 "큰"이라는 부분인데, 매개변수라는 게 엄청 많다는 뜻입니다. 매개변수가 많을수록 더 복잡한 패턴을 인식할 수 있어서 똑똑해지는 거거든요. 예를 들어 챗지피티 4는 아마 수백억 개 이상의 매개변수가 있을 걸로 알려져 있는데, 이게 왜 중요하냐면 모델의 능력과 직결되기 때문입니다.
그런데 LLM이 완벽한 건 아니거든요. 사실 통계적으로 다음 단어를 예측하는 거라서 가끔 틀린 정보를 마치 참인 것처럼 말해요. 이걸 할루시네이션이라고 부르는데, 개발자들도 이 문제 해결하려고 지금 열심히 연구 중이라고 합니다.
그리고 한 가지 더 알아두면 좋은 건, LLM 자체는 그냥 텍스트만 생성할 수 있다는 거예요. 이미지도 생성하고, 코드도 실행하고 뭐 이런 건 다른 도구나 확장 기능을 연결해서 하는 거죠. 요즘 AI 서비스들이 다기능인 것처럼 보이는 이유가 여러 기술을 조합해서 쓰기 때문이랍니다.