向量数据库选型:pgvector / Qdrant / Milvus
RAG 的存储底座怎么选,从够用到高性能的几个常见选项。
做 RAG 绕不开向量库——存 embedding、做相似度检索。几个主流选择:
| 方案 | 特点 | 适合 |
|---|---|---|
| pgvector | Postgres 扩展,数据和业务库放一起 | 已有 PG、数据量中小,首选省事 |
| Qdrant | Rust 写的专用向量库,快、好部署 | 中大规模,要性能和过滤 |
| Milvus | 分布式,海量向量 | 千万级以上、企业级 |
| Chroma | 轻量、本地开发友好 | 原型 / 小项目 |
- 先用 pgvector:如果你已经在用 Postgres,一个扩展搞定,别上来就分布式。
- 数据涨到百万级、检索变慢、需要复杂元数据过滤,再换 Qdrant。
- 真到千万/亿级再考虑 Milvus 那一套。
检索质量 > 向量库选型。embedding 模型选得好、切块合理、加上 rerank,比换个更快的库对效果提升大得多。先把检索调好,再谈性能。