AI 엔진중급
Whisper
OpenAI Whisper · 위스퍼
Whisper는 OpenAI가 2022년 오픈소스로 공개한 STT 모델로, 68만 시간 데이터로 훈련된 인코더-디코더 트랜스포머다. GitHub 스타 75,000+, 월간 다운로드 410만으로 STT의 사실상 표준이다.
- •Large-v3(1.55B) WER 6.5%. Turbo 버전은 6배 빠른 속도(809M 파라미터)
- •99개 언어 단일 모델. 파인튜닝 모델 652개, whisper.cpp(38K 스타)로 에지 배포 가능
- •gpt-4o-transcribe(WER 2.46%)가 Whisper 위에 LLM 맥락 이해를 얹은 다음 세대
- •한국어 WER ~11%로 영어(6.5%) 대비 낮은 정확도 — 교착어 특성과 훈련 데이터 67% 영어 편향