Milvus

La base de datos vectorial de código abierto más escalable para aplicaciones de IA — construida para miles de millones de vectores

Milvus es una base de datos vectorial de código abierto creada específicamente para búsquedas de similitud escalables y aplicaciones de IA. Originalmente creada por Zilliz y donada a la LF AI & Data Foundation, Milvus impulsa cargas de trabajo de IA en producción en empresas como NVIDIA, AT&T, IBM y Salesforce. Es la opción preferida cuando necesitas escalar a miles de millones de vectores.

GitHub: milvus-io/milvusarrow-up-right — 32K+ ⭐


Milvus vs Qdrant — Cuándo elegir cuál

Criterios
Milvus
Qdrant

Escala

Miles de millones de vectores

Cientos de millones

Arquitectura

Distribuido (múltiples servicios)

Binario único

Complejidad de configuración

Más alto

Más bajo

Soporte de índice en GPU

✅ GPU FAISS nativo

Limitado

Multitenencia

✅ Particiones + alias

Basado en colecciones

Ingesta por streaming

✅ Kafka/Pulsar

Limitado

Búsqueda híbrida

✅ Denso + disperso

Opción gestionada en la nube

Zilliz Cloud

Qdrant Cloud

circle-check

Arquitectura de Milvus

Milvus en modo standalone (servidor único) incluye:

  • milvus — el servicio principal (coordinadores de proxy, consulta, datos e índice)

  • etcd — almacenamiento de metadatos y descubrimiento de servicios

  • MinIO — almacenamiento de objetos para datos de segmentos

En modo distribuido (clúster), cada componente escala de forma independiente.


Prerrequisitos

  • Cuenta en Clore.ai con alquiler de GPU

  • Docker Compose (usualmente preinstalado)

  • Conocimientos básicos de Python

  • 16GB+ de RAM (32GB recomendados para producción)


Paso 1 — Alquila un servidor GPU en Clore.ai

  1. Ve a clore.aiarrow-up-rightMarketplace

  2. GPU recomendada: RTX 4090 o A100 para indexación acelerada por GPU

  3. Alternativa CPU: Cualquier servidor con 32GB+ de RAM para indexación basada en CPU

Requisitos mínimos:

  • CPU: 8 núcleos

  • RAM: 16GB (32GB recomendados)

  • Disco: 50GB SSD/NVMe

  • GPU: Opcional (requerida solo para tipos de índices en GPU)

circle-info

Tipos de índices GPU en Milvus (IVF_FLAT_GPU, IVFSQ8_GPU) requieren GPUs con capacidad CUDA y aceleran drásticamente la construcción de índices para colecciones grandes. Si planeas indexar con frecuencia más de 10M de vectores, la indexación en GPU se amortiza rápidamente.


Paso 2 — Desplegar Milvus en modo standalone

Imagen Docker:

Milvus standalone requiere etcd y MinIO. Usa Docker Compose para la configuración más sencilla.

Puertos:

  • Puerto 19530: Puerto SDK/gRPC de Milvus (principal)

  • Puerto 9091: API REST de Milvus y verificación de estado (interno)

Variables de entorno:


Paso 3 — Configurar con Docker Compose

Conéctate por SSH a tu servidor Clore.ai y crea el archivo compose:

Personalizar docker-compose.yml

Iniciar Milvus


Paso 4 — Instalar el cliente de Python


Paso 5 — Crear una colección

En Milvus, una colección es similar a una tabla de base de datos. Tiene un esquema con campos tipados, incluidos campos vectoriales.


Paso 6 — Crear índice

Antes de cargar datos para búsqueda, crea un índice apropiado:


Paso 7 — Insertar datos


Paso 8 — Buscar y consultar

Búsqueda semántica básica

Búsqueda filtrada

Búsqueda híbrida (Denso + Disperso)


Paso 9 — Construir un servicio RAG


Paso 10 — Monitorizar y gestionar


Solución de problemas

Servicios que no arrancan

Conexión rechazada en 19530

Tiempo de espera en la construcción de índices para colecciones grandes

Alto uso de memoria


Guía de selección de tipo de índice

Tipo de índice
Mejor para
Memoria
Velocidad
GPU requerida

FLAT

Pequeño (<1M), búsqueda exacta

Alta

Lento

No

IVF_FLAT

Medio (1M–10M)

Medio

Bueno

No

HNSW

Baja latencia, <100M

Alta

Excelente

No

IVF_SQ8

Comprimido, grande

Bajo

Bueno

No

GPU_IVF_FLAT

Consultas por lotes rápidas

GPU+RAM

Mejor

DISKANN

Escala de miles de millones

Bajo (disco)

Bueno

No


Benchmarks de rendimiento

Tamaño de colección
Índice
GPU
QPS

1M de vectores

HNSW

RTX 3090

~8,000

10M de vectores

IVF_FLAT

RTX 4090

~2,500

10M de vectores

GPU_IVF_FLAT

A100

~12,000

100M de vectores

DISKANN

A100

~1,200


Recursos adicionales


Milvus en Clore.ai es la solución ideal para aplicaciones de IA que necesitan escalar más allá de cientos de millones de vectores. Combinado con generación de embeddings acelerada por GPU, puedes construir sistemas de búsqueda semántica y RAG de clase mundial a una fracción del coste de nubes gestionadas.


Recomendaciones de GPU en Clore.ai

Caso de uso
GPU recomendada
Coste estimado en Clore.ai

Desarrollo/Pruebas

RTX 3090 (24GB)

~$0.12/gpu/hr

Búsqueda vectorial en producción

RTX 3090 (24GB)

~$0.12/gpu/hr

Embeddings de alto rendimiento

RTX 4090 (24GB)

~$0.70/gpu/hr

💡 Todos los ejemplos en esta guía pueden desplegarse en Clore.aiarrow-up-right servidores GPU. Navega las GPUs disponibles y alquila por hora — sin compromisos, acceso root completo.

Última actualización

¿Te fue útil?