AI 활용입문
AI 자막과 번역
AI Subtitles · AI Dubbing · AI 더빙 · Whisper
음성 인식(STT)으로 영상의 음성을 텍스트로 전환하고, 다국어 자막·더빙으로 확장하는 기술이다. Whisper Large-v3가 99개 언어를 지원하고 WER 2.7%(클린 영어)를 달성했다.
- •자막이 시청 완료율 80% 향상, 더빙이 정보 유지율 40% 증가
- •Whisper Large-v3: 500만 시간 훈련, 15.5억 파라미터, 99개 언어 지원
- •GPT-4o-transcribe WER 2.46%로 모든 Whisper 버전 능가 (2025.03)
- •YouTube에 10억+ 자막 달린 영상, 일일 1,500만 뷰가 자동 자막에서 발생