开源云原生向量库:面向数十亿规模相似度检索
Milvus 在 milvus.io/docs 文档化高性能向量数据库,用于存储、索引与检索嵌入向量,支持元数据过滤与混合检索。部署含 Milvus Lite(pip install pymilvus,笔记本/边缘)、Milvus Standalone(单 Docker 镜像)、Kubernetes 上 Milvus Distributed(见 install-overview)。官方 SDK 含 PyMilvus、Go、Java、Node.js、C#;Zilliz Cloud 提供托管 Milvus。架构分层接入/协调/工作/存储,对象存储后端含 MinIO、S3、Azure Blob。
使用场景
- Kubernetes 上数十亿向量规模生产 RAG
- 向量相似度+结构化过滤的推荐系统
- Milvus Lite 原型后迁移 Standalone/Distributed
- 与 zilliztech/mcp-server-milvus 搭配的 Agent 记忆层
- 结合外部嵌入器的多模态向量检索
主要功能
- HNSW、DiskANN 等 ANN 索引与标量/JSON 元数据过滤
- Milvus Lite、Standalone、Distributed 三种部署
- 混合稠密-稀疏与多向量支持
- PyMilvus MilvusClient 集合/写入/检索 API
- LF AI & Data 基金会项目,Zilliz 为核心维护方
相关推荐
相关推荐
3 收录条目
Weaviate
Weaviate 在 docs.weaviate.io/weaviate 文档化开源向量数据库,存储对象与向量嵌入,支持语义、关键词与混合检索、RAG、重排与 Agent 工作流。生态含 Docker/Kubernetes 自托管、Weaviate Cloud、Query Agent 与 Weaviate Embeddings。客户端含 Python(weaviate-client v4,需 1.23.7+)、TypeScript、Go、Java,经 REST/gRPC/GraphQL API。
Pinecone
Pinecone 在 docs.pinecone.io 文档化全托管向量数据库,用于生产规模存储、索引与检索高维嵌入。Serverless 索引支持文档 schema 混合稠密向量、稀疏向量与全文检索字段及元数据过滤。官方 SDK 含 Python、Node.js、Java、Go;REST API 有 Starter/Standard/Enterprise 档位速率限制。pinecone.io 亦含 Pinecone Assistant、Dedicated Read Nodes、BYOC、Nexus 及 MCP 集成。
Qdrant
Qdrant 在 qdrant.tech/documentation 文档化 AI 原生向量搜索引擎,用于存储、索引与查询高维向量及可选 payload,支持稠密、稀疏与多向量配置。官方指南涵盖 Docker/Kubernetes 自托管、Qdrant Cloud(AWS/GCP/Azure)、Hybrid/Private Cloud 与 Qdrant Edge 嵌入式检索。客户端含 Python(qdrant-client)、JavaScript/TypeScript(@qdrant/js-client-rest)、Rust、Go、Java、.NET,经 REST/gRPC API(见 api.qdrant.tech)。