生成AI × 検索 (RAG) アーキテクチャが定着し、「どの LLM を使うか」と同等に「どの Vector Database を使うか」がビジネス成果を左右するようになりました。2025 年は次の 4 強が大注目です。
項目 | Pinecone Serverless | Weaviate v2 | LanceDB | Chroma Enterprise |
---|---|---|---|---|
発表 | 2025‑03 | 2024‑12 | 2025‑01 | 2025‑02 |
特徴 | 完全マネージド・オートスケール | Hybrid Search & Schema‑free | Embedded + Arrow columnar | ACIDトランザクション |
検索方式 | HNSW + PQ | HNSW + BM25 | IVF‑Flat | Hierarchical PQ |
ストレージ | S3 / GCS | LSM‑Tree | Parquet / Arrow | Cloud Blob |
マルチテナント | ◎ | ○ | ローカルのみ | ◎ |
従量課金 | $0.15/GB‑mo | Self‑host可 | OSS (無料) | $0.12/GB‑mo |
DB | 99p レイテンシ | QPS limit | 月コスト(推定) |
---|---|---|---|
Pinecone | 65 ms | 21k | $420 |
Weaviate v2 | 72 ms | 18k | $190 (EKS) |
LanceDB | 58 ms* | 6k | $75 (EBS) |
Chroma Ent. | 70 ms | 20k | $360 |
*LanceDB は単一ノードでの測定。クラスタリング未対応。
OpenAI は Embeddings‑v4
リリースを示唆。スパース + 密ベクトルのハイブリッドインデックス標準化が進み、「リッチベクトルDB」という新カテゴリが立ち上がる見込みです。