2026.06.21 접속자 23명

로그인 | 회원가입 | AI 서비스

HOT

[프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 프롬프트 엔지니어링도 결국 '문맥'이 핵심인 것 같아요 [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [AI뉴스] 국내 AI 기업 차세대 반도체 경쟁 시작된 듯... 리벨리온, 퓨리오사 뭐가 어떤 건지 정리해주실 분? [기술 Q&A] LLM 파인튜닝 후 토큰 효율이 확 떨어졌는데 이게 정상인가요? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 프롬프트 엔지니어링도 결국 '문맥'이 핵심인 것 같아요 [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [AI뉴스] 국내 AI 기업 차세대 반도체 경쟁 시작된 듯... 리벨리온, 퓨리오사 뭐가 어떤 건지 정리해주실 분? [기술 Q&A] LLM 파인튜닝 후 토큰 효율이 확 떨어졌는데 이게 정상인가요? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요?

목록

LLM 토큰 개수 세는 게 왜 이렇게 헷갈리죠?

딥러닝장인 2026.04.06 16:35 조회 127 추천 11 댓글 3건

최근에 GPT API 써서 작은 프로젝트 하나 만들고 있는데, 토큰 개수 계산이 자꾸 맞지 않네요. 공식 문서에서는 `tiktoken` 라이브러리로 세라고 했는데, 실제로 API 요청할 때 반환되는 usage 값이랑 자꾸 다르더라고요.

특히 한국어 텍스트 처리할 때 더 심한 것 같은데, 같은 문장인데도 모델마다 토큰 개수가 달라요. gpt-4-turbo는 이렇게 세고 gpt-4o는 저렇게 세는 식으로요. 혹시 이게 정상인 건가요 아니면 제가 잘못 이해하고 있는 건지 모르겠습니다.

비용 추정할 때마다 약간씩 밀려서 예산을 넉넉하게 잡고 있긴 한데, 정확하게 계산하는 방법이 있으면 알려주면 감사하겠습니다. 혹시 프롬프트 토큰이랑 완료 토큰을 따로 집계하셔야 하는 건가요?

아 그리고 시스템 프롬프트도 매번 카운트되는 거 맞죠? 제 생각엔 같은 시스템 프롬프트 여러 번 보낼 때 뭔가 최적화가 있을 것 같은데 제가 착각하는 건가 싶네요.

궁금한 점이 많아서 여쭤봅니다. 경험 많으신 분들 의견 부탁드려요.

추천 11

이전글LLM 파인튜닝할 때 데이터셋 크기가 얼마나 중요한가요?26.04.07
다음글AI 코딩 도구 써보니 생각보다 손에 안 잡히더라고요26.04.06

댓글 3

댓글목록

현실주의자

26-04-08 06:35

모델마다 토크나이저가 다르거든요. gpt-4-turbo랑 gpt-4o는 실제로 다른 tokenizer 쓰고 있어서 같은 텍스트도 개수가 달라요. 한국어는 더 심한데 다언어 최적화 수준이 모델마다 다르기 때문입니다. 정확한 계산은 실제 API 호출 후 반환되는 usage 값을 믿는 게 가장 정확하고, 예산 추정할 땐 그냥 여유 있게 잡는 게 현실적이에요. 시스템 프롬프트도 매번 카운트되는 게 맞습니다.

인공지능개그맨

26-04-28 11:16

저도 한국어 토큰 계산 때문에 계속 밀렸어요 ㅠㅠ

AI새싹

26-05-07 13:16

저도 같은 문제로 헤맸는데, 모델별로 토크나이저가 다르기 때문에 당연히 다르더라고요. gpt-4-turbo와 4o는 아예 다른 토크나이저 쓰거든요. tiktoken은 참고용이고 정확한 계산은 실제 API 응답의 usage 값을 믿는 게 낫습니다. 한국어는 더 예측이 어려워서 그냥 여유있게 잡는 게 맞아요. 시스템 프롬프트도 매번 카운트되는 거 맞고, 아직까진 캐싱 같은 최적화는 없으니 늘어나는 대로 가면 됩니다.