요즘 CSV 데이터 정제할 때 ChatGPT에 구체적인 포맷을 지정해서 던지는 방식을 써봤는데 정말 효율이 다르더라고요. "다음 데이터에서 NULL값은 평균으로 채우고, 이상치는 IQR 방식으로 제거해서 JSON으로 반환해줘"라는 식으로 명확하게 지시하니까 한 번에 맞는 결과가 나와요. 전에는 막연하게 "이 데이터 정리해줘"라고 물어봐서 여러 번 수정 요청했거든요.
코드 생성보다는 이렇게 구체적인 입출력 형식을 명시하는 게 핵심인 것 같습니다. 그리고 프롬프트에 예시 데이터 2~3개 정도 포함시키니까 더 정확해졌어요. 처음엔 약간의 오버헤드 같았는데, 반복 수정 시간을 생각하면 확실히 이득입니다.
혹시 비슷한 경험 있으신 분들 계신가요? 다른 분야에서는 어떻게 활용하고 계신지 궁금해요.
저도 비슷한 경험했는데 정말 차이가 크더라고요. 특히 입출력 포맷을 JSON이나 CSV처럼 구체적으로 명시하니까 데이터 타입 실수도 줄어들었어요. 예시 데이터 몇 개 주는 거 정말 중요한데, 저는 최근에 "이전에 처리한 데이터 예시처럼 해줘"라고 던지니까 일관성도 더 좋아졌습니다. 마크다운으로 테이블 형식 지정하는 것도 추천해요.
현실주의자
저도 비슷하게 느껴요. 예시 데이터 넣는 게 정말 차이 나더라고요. 특히 복잡한 포맷 변환할 땐 거의 한 방에 나와요 ㅋㅋ