Motor de búsqueda nativo en object storage: vector, full-text e híbrida a escala petabyte
turbopuffer documenta en turbopuffer.com/docs un motor rápido sobre object storage (S3, GCS, Azure) con caché NVMe/memoria. WAL, índice ANN SPFresh, BM25, filtros nativos, branching. API: ANN, full-text, híbrida, regex. Límites observados: 4T+ docs, 10M+ writes/s; tradeoffs: latencia de escritura y consultas frías.
Casos de uso
- First-stage retrieval para RAG
- Búsqueda vectorial coste-eficiente
- Híbrida con filtros de alto recall
- Namespaces petabyte con hot sets
- Capas de búsqueda para agentes
Funciones principales
- ANN SPFresh optimizado para object storage
- Filtrado nativo en consultas vectoriales
- Híbrida vector + BM25 con namespaces branching
- Escrituras consistentes vía WAL
- Multi-tenant o BYOC
Relacionados
Relacionados
3 Entradas indexadas
Typesense
Typesense documenta en typesense.org/docs un motor open source con búsqueda tolerante a typos, facetas y vectores. Vector search: KNN con embeddings importados o auto-generados vía OpenAI, PaLM o modelos ts/* en Hugging Face. Híbrida con rank fusion y alpha; similar por ID; HNSW y flat_search_cutoff. Cloud o self-hosted con API REST.
LanceDB
LanceDB documenta en docs.lancedb.com un lakehouse multimodal sobre el formato Lance para vectores, metadatos y embeddings en tablas unificadas. LanceDB OSS es biblioteca embebida (Python, TypeScript, Rust); LanceDB Enterprise es lakehouse distribuido gestionado. Incluye búsqueda vector/semántica, BM25, híbrida con SQL, versionado e integración con object stores.
Qdrant
Qdrant documenta en qdrant.tech/documentation un motor de búsqueda vectorial para almacenar, indexar y consultar vectores de alta dimensión con payloads opcionales (densos, dispersos y multi-vector). Cubre Docker/Kubernetes, Qdrant Cloud, Hybrid/Private Cloud y Qdrant Edge. Clientes oficiales: Python, JS/TS, Rust, Go, Java y .NET vía REST/gRPC.