AI 기술중급

Self-Refine

Self-Refine Prompting · 자기 개선

Self-Refine은 단일 LLM이 생성자 → 비평자 → 개선자 세 역할을 순환하며, 자체 비판과 개선을 반복하여 출력 품질을 높이는 기법이다. Madaan et al.(2023)이 NeurIPS에서 발표했다.

•Madaan et al.(2023, NeurIPS): 7가지 과제에서 평균 약 20% 절대적 성능 향상
•감독 학습 데이터, 추가 훈련, 강화학습 없이 동일 모델 하나로 반복 개선
•Anthropic "Building Effective Agents"에서 핵심 에이전트 워크플로우 패턴으로 소개
•추론 모델에서도 여전히 유효 — 추론 능력과 별개의 자기 검증 프로세스

더 깊이 알고 싶다면

강의 보기 블로그 읽기

아키피디아로 돌아가기