AI 기술중급

멀티턴 대화

Multi-Turn Conversation · 멀티턴 대화 설계 · 다회차 대화

멀티턴 대화 설계는 LLM과의 여러 차례 왕복 대화에서 맥락을 유지하고, 메모리를 관리하며, 대화 흐름을 제어하는 기술이다. 컨텍스트 윈도우가 1M 토큰으로 확장된 시대에도 길이 자체가 성능을 떨어뜨리는 구조적 한계가 존재한다.

  • Shi et al.(ICLR 2026): 멀티턴에서 단일턴 대비 평균 39% 성능 하락 — 20만+ 시뮬레이션으로 실증
  • 하락의 대부분은 능력 저하가 아닌 "신뢰성 저하" — 답변 품질이 들쭉날쭉해지는 것이 핵심
  • 핵심 질문을 메시지 끝에 반복하는 것만으로 하락의 상당 부분 회복 가능
  • 계층적 메모리(워킹+에피소딕+시맨틱)로 맥락 관리가 2026년 최적 접근
  • Levy et al.(EMNLP 2025): 완벽한 검색에서도 입력 길이 증가만으로 13.9~85% 성능 저하

더 깊이 알고 싶다면

아키피디아로 돌아가기