저도 비슷한 고민 했는데, 결국 실무에선 4k~8k면 대부분 충분하더라고요. 큰 윈도우는 장문 분석할 때만 가끔 쓰고요.
응답 속도 같은 경우 확실히 좀 더 느린 경향이 있어서, 비용 대비로는 크게 메리트 없는 것 같습니다. 차라리 모델 품질 자체에 투자하는 게 효율적이었어요.
프로덕션이면 더더욱 응답 속도랑 비용이 중요하니까 작은 윈도우 모델로 충분할 거 같네요.
응답 속도 같은 경우 확실히 좀 더 느린 경향이 있어서, 비용 대비로는 크게 메리트 없는 것 같습니다. 차라리 모델 품질 자체에 투자하는 게 효율적이었어요.
프로덕션이면 더더욱 응답 속도랑 비용이 중요하니까 작은 윈도우 모델로 충분할 거 같네요.