AI 기술중급
벡터 데이터베이스
Vector Database · Vector DB · 벡터DB
벡터 데이터베이스는 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전용 데이터베이스다. RAG 시스템의 검색 엔진 역할을 하며, ANN(근사 최근접 이웃) 알고리즘으로 수십억 벡터에서 밀리초 검색을 가능하게 한다.
- •Pinecone이 시장 점유율 약 70%. pgvector는 PostgreSQL 확장으로 별도 DB 불필요 — 16배 처리량, 28배 낮은 p95 지연
- •HNSW 알고리즘: 95%+ 재현율, 1~2ms/쿼리 — 1,000만 벡터 이하에서 속도/정확도 최적
- •오픈소스: Qdrant(29,000+ 스타, Rust), Chroma(경량 프로토타이핑), Milvus(수십억 스케일)
- •2026년 트렌드: PostgreSQL에 pgvector 추가하여 관계형+벡터를 하나의 DB로 통합하는 팀 증가