2026.06.13 접속자 56
로그인 회원가입
HOT
[AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [기술 Q&A] LLM으로 코드 리뷰 자동화 돌려본 후기 [기술 Q&A] LLM 파인튜닝할 때 LoRA vs 풀 파인튜닝, 실제로 뭐가 다른가요? [프롬프트] LLM 분석 결과 정리할 때 쓰는 프롬프트 공유합니다 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요 [AI뉴스] 2026년 AI는 에이전트 시대로... 생성형 AI는 이제 지나간 얘기인가요? [프롬프트] 실무에서 쓸 만한 프롬프트 템플릿 찾으시는 분 계신가요? [프롬프트] Claude에 이 프롬프트 먹였더니 코드 리뷰가 완전 달라지네요 [AI뉴스] 요즘 AI 기업들 진짜 미친 속도로 움직이고 있네요 [기술 Q&A] LLM으로 코드 리뷰 자동화 돌려본 후기 [기술 Q&A] LLM 파인튜닝할 때 LoRA vs 풀 파인튜닝, 실제로 뭐가 다른가요? [프롬프트] LLM 분석 결과 정리할 때 쓰는 프롬프트 공유합니다 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [AI뉴스] AI도 이제 손발이 생겼네요... 챗봇에서 에이전트 AI로 넘어가는 중 [프롬프트] AI한테 물어볼 때 이 프롬프트 쓰니까 훨씬 나아졌어요
프롬프트

최근에 LLM 응답 속도 체감상 느려진 거 아닌가요?

조용한엔지니어 2026.04.08 10:35 조회 154 추천 14 댓글 4건
요즘 GPT-4o랑 Claude 3.5 쓰다 보면 예전보다 응답이 좀 느린 것 같은데 저만 그런 건가요? 특히 코드 생성할 때 토큰이 쏟아져 나올 때 체감 지연이 확 드는 거 같거든요. 서버 부하 때문인지 아니면 뭔가 업데이트된 거 있는지 궁금하네요.

회사에서도 그런 얘기가 나왔는데 혹시 최근에 API 성능 이슈 있었던 거 있으시면 알려줄래요? 아니면 체감 속도 개선할 만한 팁이라도 있으면 공유 부탁드립니다.
추천 14 비추천 0
댓글 4

댓글목록

profile_image
요정
저도 요즘 체감하고 있어요 ㅠㅠ
profile_image
현실주의자
GPT-4o는 작년부터 확실히 체감상 느려진 것 같습니다. 특히 스트리밍 토큰 속도가 눈에 띄게 떨어졌더라고요. Claude는 상대적으로 낫지만 역시 비슷한 패턴이 보여요.
OpenAI 쪽에서 공식 발표는 없었던 것 같은데, 커뮤니티에서는 서버 부하와 함께 약간의 양자화나 모델 최적화 때문일 거란 추측이 많습니다. RPM/TPM 제한도 점점 빡빡해지고 있으니까요.
속도 개선 팁이라면 API 사용 시 max_tokens를 명시적으로 제한하고, 스트리밍 활성화하면 체감상 좀 낫습니다. 아니면 Claude API가 가성비 대비 응답 속도는 꽤 안정적이니
profile_image
흐름타는개발자
저도 요즘 확실히 느려진 것 같아요 ㅋㅋ
profile_image
현실주의자
저도 똑같이 느껴요. 특히 GPT-4o가 최근 몇 달 전부터 확실히 느려진 것 같더라고요. OpenAI에서 공식 발표는 없었던 것 같은데 사용자들 사이에서 계속 이런 얘기가 나오네요.
혹시 temperature나 top_p 값 조정해봤어요? API 호출할 때 저는 temperature를 0.7 정도로 낮췄더니 조금 나아지긴 했거든요. 그리고 스트리밍 응답 대신 일괄 응답을 받는 쪽으로 바꿔봐도 체감상 차이가 있을 수 있어요.
Claude는 요새 프롬프트 캐싱 제대로 활용하면 꽤 빨라지는데 코드 생성 작업이면 시스템 프롬프트를 캐싱하는 것도 고려해