Motor de búsqueda nativo en object storage: vector, full-text e híbrida a escala petabyte

turbopuffer documenta en turbopuffer.com/docs un motor rápido sobre object storage (S3, GCS, Azure) con caché NVMe/memoria. WAL, índice ANN SPFresh, BM25, filtros nativos, branching. API: ANN, full-text, híbrida, regex. Límites observados: 4T+ docs, 10M+ writes/s; tradeoffs: latencia de escritura y consultas frías.

Categoría Herramientas para desarrolladores

Precio Usage-based pricing (see turbopuffer.com/pricing)

Plataformas Cloud / API / Python / Rust

vector-searchfull-text-searchhybrid-search

Casos de uso

First-stage retrieval para RAG
Búsqueda vectorial coste-eficiente
Híbrida con filtros de alto recall
Namespaces petabyte con hot sets
Capas de búsqueda para agentes

Funciones principales

ANN SPFresh optimizado para object storage
Filtrado nativo en consultas vectoriales
Híbrida vector + BM25 con namespaces branching
Escrituras consistentes vía WAL
Multi-tenant o BYOC

Relacionados

3 Entradas indexadas

Typesense

Herramientas para desarrolladoresOpen source

Typesense documenta en typesense.org/docs un motor open source con búsqueda tolerante a typos, facetas y vectores. Vector search: KNN con embeddings importados o auto-generados vía OpenAI, PaLM o modelos ts/* en Hugging Face. Híbrida con rank fusion y alpha; similar por ID; HNSW y flat_search_cutoff. Cloud o self-hosted con API REST.

LanceDB

Herramientas para desarrolladoresOpen source

LanceDB documenta en docs.lancedb.com un lakehouse multimodal sobre el formato Lance para vectores, metadatos y embeddings en tablas unificadas. LanceDB OSS es biblioteca embebida (Python, TypeScript, Rust); LanceDB Enterprise es lakehouse distribuido gestionado. Incluye búsqueda vector/semántica, BM25, híbrida con SQL, versionado e integración con object stores.

Qdrant

Herramientas para desarrolladoresOpen source

Qdrant documenta en qdrant.tech/documentation un motor de búsqueda vectorial para almacenar, indexar y consultar vectores de alta dimensión con payloads opcionales (densos, dispersos y multi-vector). Cubre Docker/Kubernetes, Qdrant Cloud, Hybrid/Private Cloud y Qdrant Edge. Clientes oficiales: Python, JS/TS, Rust, Go, Java y .NET vía REST/gRPC.

turbopuffer

Casos de uso

Funciones principales

Relacionados

Typesense

LanceDB

Qdrant

Noticias relacionadas