AI 기술중급
Self-Refine
Self-Refine Prompting · 자기 개선
Self-Refine은 단일 LLM이 생성자 → 비평자 → 개선자 세 역할을 순환하며, 자체 비판과 개선을 반복하여 출력 품질을 높이는 기법이다. Madaan et al.(2023)이 NeurIPS에서 발표했다.
- •Madaan et al.(2023, NeurIPS): 7가지 과제에서 평균 약 20% 절대적 성능 향상
- •감독 학습 데이터, 추가 훈련, 강화학습 없이 동일 모델 하나로 반복 개선
- •Anthropic "Building Effective Agents"에서 핵심 에이전트 워크플로우 패턴으로 소개
- •추론 모델에서도 여전히 유효 — 추론 능력과 별개의 자기 검증 프로세스