AI 활용입문

AI 자막과 번역

AI Subtitles · AI Dubbing · AI 더빙 · Whisper

음성 인식(STT)으로 영상의 음성을 텍스트로 전환하고, 다국어 자막·더빙으로 확장하는 기술이다. Whisper Large-v3가 99개 언어를 지원하고 WER 2.7%(클린 영어)를 달성했다.

  • 자막이 시청 완료율 80% 향상, 더빙이 정보 유지율 40% 증가
  • Whisper Large-v3: 500만 시간 훈련, 15.5억 파라미터, 99개 언어 지원
  • GPT-4o-transcribe WER 2.46%로 모든 Whisper 버전 능가 (2025.03)
  • YouTube에 10억+ 자막 달린 영상, 일일 1,500만 뷰가 자동 자막에서 발생

더 깊이 알고 싶다면

아키피디아로 돌아가기