AI 엔진중급

DeepSeek

DeepSeek-V3 · DeepSeek-R1 · 딥시크

DeepSeek은 중국 헤지펀드 High-Flyer가 설립한 AI 연구소로, MoE 아키텍처와 혁신적 훈련 기법으로 프론티어급 성능을 오픈소스로 공개하며 글로벌 AI 가격 구도를 뒤흔든 존재다. $5.6M 훈련 비용과 R1 공개는 2025년 1월 "AI 스푸트니크 모먼트"로 불렸다.

  • V3는 671B 총 파라미터 중 37B만 활성화하여 GPT-4급 성능을 $5.6M에 달성했다. 256개 전문가 + MLA(Multi-Head Latent Attention)가 핵심이다.
  • R1은 순수 RL로 "아하 모먼트"(자발적 추론 패턴 발현)를 달성했고, 80만 개 추론 샘플의 증류로 작은 모델에도 추론 능력을 전이했다.
  • V3.2(2026.03)는 AIME 2025에서 96.0%로 GPT-5 High(94.6%)를 초과하며, 입력 $0.26/출력 $0.38의 파괴적 가격을 유지한다.
  • 2025년 1월 R1 공개 후 Nvidia 시가총액 $589B가 증발하며 미중 AI 패권 논쟁의 중심에 섰다.

관련 개념

더 깊이 알고 싶다면

아키피디아로 돌아가기