2026.06.12 접속자 17
로그인 회원가입
HOT
[AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요 [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [AI뉴스] 요즘 오픈소스 모델들 진짜 후지지 않네요 [프롬프트] 실제 일할 때 쓰는 프롬프트 패턴 정리해봤습니다 [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요 [AI뉴스] 요즘 AI 회사들 자금 유치 진짜 미친 수준이더라고요
AI연구

요즘 오픈소스 AI 모델 급성장 중이네요... 내 PC에서도 돌릴 수 있는 수준까지

딥러닝장인 2026.05.12 19:30 조회 620 추천 14 댓글 4건
최근에 오픈소스 AI 모델들이 정말 빠르게 발전하고 있더라고요. 2026년을 거치며 70B급 모델이 RTX 4090 한 장으로 양자화 구동 가능한 수준까지 발전했고, 한국어 성능도 상용 모델에 근접했습니다. 이게 정말 놀라운 부분인데 예전엔 고가의 GPU를 여러 장 써야만 했거든요.

구글은 최근 '젬마 4(Gemma 4)'를 공개했는데, 고급 추론과 에이전트 기반 워크플로우를 위해 특수 설계되었으며 파라미터당 전례 없는 수준의 지능을 제공하는 것이 특징입니다. 젬마 4는 아파치 2.0 라이선스로 제공되어, 상업적 활용을 포함한 폭넓은 사용이 가능합니다. 오픈소스인데 상업용도 쓸 수 있다는 게 의외네요.

딥시크도 화웨이 칩 기술에 맞춘 새로운 플래그십 모델 '딥시크-V4-프로'를 출시했습니다. 프로 버전은 1조6000억개의 매개변수로, 이제까지 등장한 오픈소스 모델 중 가장 크다고 합니다. 다만 가성비는 뛰어나지만, 오픈AI나 앤트로픽 등의 프론티어 모델에는 성능이 미치지 못하는 것으로 나타났습니다.

메타의 Llama 3.3 70B는 GPT-4o 클래스 성능을 4-bit 양자화 시 RTX 4090 1장으로 돌릴 수 있다는 점에서 사실상 표준이며, 코드, 한국어, 추론 어느 하나 빠지지 않고 Ollama·LM Studio 모두 1순
추천 14 비추천 0
댓글 4

댓글목록

profile_image
흐름타는개발자
4090 한장으로 70B 돌린다니 진짜 대박이네요 ㅋㅋ
profile_image
AI새싹
오픈소스 성능이 진짜 미쳤네요 ㅎㅎ
profile_image
궁금하면
와 4090 한 장으로 돌린다니 진짜 대박이네요 ㅋㅋ
profile_image
궁금하면
오픈소스 성능 진짜 미쳤네요 ㅋㅋ