2026.04.23 접속자 13
로그인 회원가입
HOT
[AI뉴스] 2026년 벌써 AI 투자 열풍인데 우리나라 스타트업도 잘 되고 있네요 [프롬프트] GPT한테 "역할 정하고 시작하기" 프롬프트 효과 진짜 좋네요 [프롬프트] Claude 프롬프트로 코드리뷰 받아보신 분 계신가요? [프롬프트] Claude에 이 프롬프트 박으니까 코드리뷰가 확 달라졌어요 [기술 Q&A] LLM 토큰 계산 관련해서 좀 헷갈리는데 이거 맞나요? [프롬프트] Claude 프롬프트로 코드 리뷰 자동화해보니 정말 쓸만하네요 [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 팁 공유합니다 [AI뉴스] 4월 AI 뉴스 정리... 한국도 기술력 세계 3위 수준이라는데 들으셨어요? [AI뉴스] AI 기본법 1월 22일 시행된다는데 회사에서 아직도 아무것도 안 하네요 [AI뉴스] 글로벌 AI 규제 바뀌는데, 한국도 한발 물러서 있을 건 아니겠지? [AI뉴스] 2026년 벌써 AI 투자 열풍인데 우리나라 스타트업도 잘 되고 있네요 [프롬프트] GPT한테 "역할 정하고 시작하기" 프롬프트 효과 진짜 좋네요 [프롬프트] Claude 프롬프트로 코드리뷰 받아보신 분 계신가요? [프롬프트] Claude에 이 프롬프트 박으니까 코드리뷰가 확 달라졌어요 [기술 Q&A] LLM 토큰 계산 관련해서 좀 헷갈리는데 이거 맞나요? [프롬프트] Claude 프롬프트로 코드 리뷰 자동화해보니 정말 쓸만하네요 [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 팁 공유합니다 [AI뉴스] 4월 AI 뉴스 정리... 한국도 기술력 세계 3위 수준이라는데 들으셨어요? [AI뉴스] AI 기본법 1월 22일 시행된다는데 회사에서 아직도 아무것도 안 하네요 [AI뉴스] 글로벌 AI 규제 바뀌는데, 한국도 한발 물러서 있을 건 아니겠지?
프롬프트

프롬프트 엔지니어링으로 LLM 정확도 올려보신 분?

흐름타는개발자 2026.04.18 08:53 조회 17 추천 6 댓글 1건
최근에 GPT-4 API로 텍스트 분류 작업을 하고 있는데, 처음엔 간단하게 "이 텍스트를 분류해줘" 정도로 던졌더니 정확도가 70% 정도였어요. 그런데 프롬프트를 다시 정리해서 few-shot 예제 몇 개 넣고, 분류 기준을 더 구체적으로 명시하니까 89%까지 올랐거든요.

특히 효과 본 부분은 "당신은 텍스트 분류 전문가입니다" 같은 롤 프롬프팅이랑 출력 포맷을 JSON으로 강제하는 거였어요. 근데 신기한 게 같은 입력이어도 온도나 max_tokens 값에 따라 결과가 좀 달라지더라고요.

혹시 여기서 더 개선할 수 있는 방법이 있을까요? 아니면 이 정도면 차라리 파인튜닝을 고려해봐야 하나 싶기도 하고요. 비용도 신경 쓰이고 ㅠㅠ
추천 6 비추천 0
댓글 1

댓글목록

profile_image
따뜻한코더
89%까지 올리셨다니 좋네요. 저도 비슷한 경험이 있는데, 프롬프트 튜닝으로 충분하면 파인튜닝까지 갈 필요는 없을 것 같아요. 다만 더 개선하려면 few-shot 예제를 현재 분류 애매한 케이스들로 추가해보시고, Chain of Thought 패턴도 한번 시도해볼 만해요. 온도는 분류 작업이면 0.1 정도로 낮추는 게 일관성 있더라고요.