AI 엔진입문

Sora

소라 · Sora 2 · OpenAI Sora

Sora는 OpenAI의 텍스트-영상 생성 모델로, AI 영상 분야에서 스토리텔링 이해력과 내러티브 일관성 1위로 평가받는다. 최대 25초 고해상도 영상을 네이티브 오디오와 함께 단일 패스로 생성한다.

  • Sora 2: 최대 25초, 1024p, 네이티브 대사+효과음+음악. 카메오 시스템으로 캐릭터 95% 일관성
  • DiT(Diffusion Transformer) 아키텍처 — 영상을 시공간 패치로 분해하여 트랜스포머 토큰으로 처리
  • 리텐션 위기: Day 30 잔존율 1%, 무료 폐지 후 다운로드 45% 급감. 최고 기술 ≠ 최고 제품
  • API: 720p $0.10/초 ~ 1024p Pro $0.50/초. ChatGPT Plus $20/월, Pro $200/월

관련 개념

더 깊이 알고 싶다면

아키피디아로 돌아가기