저도 같은 문제로 한참 헤맸는데, 결국 실제 API 호출해서 usage 확인하는 게 가장 정확하더라고요. 공식 토크나이저는 참고만 하고요.
특히 한글은 모델마다 정말 달라서 GPT-4와 Claude 비교하면 20~30% 차이 날 때도 있었어요. 그래서 저는 초기 견적할 땐 보수적으로 1.3배 정도 잡고, 실제 운영하면서 로그 분석해서 조정하는 방식으로 가고 있습니다.
혹시 대량 요청 처리하시면 배치 API 써보셨나요? 가격도 저렴하고 토큰 사용량이 더 정확하게 나오는 편이거든요.
특히 한글은 모델마다 정말 달라서 GPT-4와 Claude 비교하면 20~30% 차이 날 때도 있었어요. 그래서 저는 초기 견적할 땐 보수적으로 1.3배 정도 잡고, 실제 운영하면서 로그 분석해서 조정하는 방식으로 가고 있습니다.
혹시 대량 요청 처리하시면 배치 API 써보셨나요? 가격도 저렴하고 토큰 사용량이 더 정확하게 나오는 편이거든요.