托管向量库:面向生产语义检索、RAG 与混合检索
Pinecone 在 docs.pinecone.io 文档化全托管向量数据库,用于生产规模存储、索引与检索高维嵌入。Serverless 索引支持文档 schema 混合稠密向量、稀疏向量与全文检索字段及元数据过滤。官方 SDK 含 Python、Node.js、Java、Go;REST API 有 Starter/Standard/Enterprise 档位速率限制。pinecone.io 亦含 Pinecone Assistant、Dedicated Read Nodes、BYOC、Nexus 及 MCP 集成。
使用场景
- 带 namespace 与元数据过滤的生产 RAG
- 大规模推荐引擎
- 单索引词法+语义混合检索
- 与 pinecone-mcp 搭配的 Agent 检索
- 需 BYOC 或 dedicated read nodes 的企业部署
主要功能
- Serverless 索引单 schema 混合 dense/sparse/FTS
- 经 score_by 的混合与多方法检索
- 托管扩展与 429 自节流
- Python/Node/Java/Go SDK 与 REST API
- Pinecone Assistant 与 BYOC
相关推荐
相关推荐
3 收录条目
Milvus
Milvus 在 milvus.io/docs 文档化高性能向量数据库,用于存储、索引与检索嵌入向量,支持元数据过滤与混合检索。部署含 Milvus Lite(pip install pymilvus,笔记本/边缘)、Milvus Standalone(单 Docker 镜像)、Kubernetes 上 Milvus Distributed(见 install-overview)。官方 SDK 含 PyMilvus、Go、Java、Node.js、C#;Zilliz Cloud 提供托管 Milvus。架构分层接入/协调/工作/存储,对象存储后端含 MinIO、S3、Azure Blob。
Weaviate
Weaviate 在 docs.weaviate.io/weaviate 文档化开源向量数据库,存储对象与向量嵌入,支持语义、关键词与混合检索、RAG、重排与 Agent 工作流。生态含 Docker/Kubernetes 自托管、Weaviate Cloud、Query Agent 与 Weaviate Embeddings。客户端含 Python(weaviate-client v4,需 1.23.7+)、TypeScript、Go、Java,经 REST/gRPC/GraphQL API。
Qdrant
Qdrant 在 qdrant.tech/documentation 文档化 AI 原生向量搜索引擎,用于存储、索引与查询高维向量及可选 payload,支持稠密、稀疏与多向量配置。官方指南涵盖 Docker/Kubernetes 自托管、Qdrant Cloud(AWS/GCP/Azure)、Hybrid/Private Cloud 与 Qdrant Edge 嵌入式检索。客户端含 Python(qdrant-client)、JavaScript/TypeScript(@qdrant/js-client-rest)、Rust、Go、Java、.NET,经 REST/gRPC API(见 api.qdrant.tech)。