AI 엔진중급

Whisper

OpenAI Whisper · 위스퍼

Whisper는 OpenAI가 2022년 오픈소스로 공개한 STT 모델로, 68만 시간 데이터로 훈련된 인코더-디코더 트랜스포머다. GitHub 스타 75,000+, 월간 다운로드 410만으로 STT의 사실상 표준이다.

  • Large-v3(1.55B) WER 6.5%. Turbo 버전은 6배 빠른 속도(809M 파라미터)
  • 99개 언어 단일 모델. 파인튜닝 모델 652개, whisper.cpp(38K 스타)로 에지 배포 가능
  • gpt-4o-transcribe(WER 2.46%)가 Whisper 위에 LLM 맥락 이해를 얹은 다음 세대
  • 한국어 WER ~11%로 영어(6.5%) 대비 낮은 정확도 — 교착어 특성과 훈련 데이터 67% 영어 편향

더 깊이 알고 싶다면

아키피디아로 돌아가기