跳到内容
Chris 的博客

向量数据库选型:pgvector / Qdrant / Milvus

RAG 的存储底座怎么选,从够用到高性能的几个常见选项。

AI 1 分钟阅读

做 RAG 绕不开向量库——存 embedding、做相似度检索。几个主流选择:

方案特点适合
pgvectorPostgres 扩展,数据和业务库放一起已有 PG、数据量中小,首选省事
QdrantRust 写的专用向量库,快、好部署中大规模,要性能和过滤
Milvus分布式,海量向量千万级以上、企业级
Chroma轻量、本地开发友好原型 / 小项目

  • 先用 pgvector:如果你已经在用 Postgres,一个扩展搞定,别上来就分布式。
  • 数据涨到百万级、检索变慢、需要复杂元数据过滤,再换 Qdrant
  • 真到千万/亿级再考虑 Milvus 那一套。

检索质量 > 向量库选型。embedding 模型选得好、切块合理、加上 rerank,比换个更快的库对效果提升大得多。先把检索调好,再谈性能。