Nerfstudio

Nerfstudio es un marco modular y amigable para investigadores para entrenar y renderizar Campos de Radiancia Neurales (NeRF) — una técnica que reconstruye escenas 3D fotorrealistas a partir de imágenes 2D. Con más de 10.000 estrellas en GitHub, es el estándar de facto para la investigación y aplicaciones de producción de NeRF. Ejecútalo en la nube GPU de Clore.ai para reconstruir escenas 3D a partir de tus propias fotos o videos.


¿Qué es Nerfstudio?

NeRF (Campo de Radiancia Neural) representa una escena 3D como una red neuronal que, dada una posición y dirección de cámara, devuelve el color y la densidad en ese punto. Al entrenar con docenas de fotografías tomadas desde diferentes ángulos, NeRF aprende una representación 3D completa que puede renderizarse desde cualquier punto de vista.

Nerfstudio proporciona:

  • Múltiples métodos NeRF: Nerfacto, Instant-NGP, Splatfacto, TensoRF y más

  • CLI y API de Python

  • Visor web interactivo (Viser) en el puerto 7007

  • Exportación a nubes de puntos, mallas y recorridos en video

  • Soporte para conjuntos de datos personalizados mediante integración con COLMAP

Casos de uso:

  • Reconstrucción de escenas 3D a partir de imágenes de drones

  • Visualización de productos a partir de fotos

  • Recorridos virtuales a partir de capturas con smartphone

  • Investigación en síntesis de vistas novedosas


Prerrequisitos

Requisito
Mínimo
Recomendado

VRAM GPU

8 GB

16–24 GB

GPU

RTX 3080

RTX 4090 / A100

RAM

16 GB

32 GB

Almacenamiento

20 GB

50+ GB

CUDA

11.8+

12.1+

circle-info

El tiempo de entrenamiento escala con la complejidad de la escena. Una escena exterior típica con 100 fotos se entrena en 10–30 minutos en una RTX 4090. El visor interactivo se actualiza en tiempo real durante el entrenamiento.


Paso 1 — Alquila una GPU en Clore.ai

  1. Inicia sesión en clore.aiarrow-up-right.

  2. Haz clic Marketplace y filtra por VRAM ≥ 16 GB.

  3. Selecciona un servidor: RTX 4090 es ideal para Nerfstudio.

  4. Establecer imagen Docker: dromni/nerfstudio:latest

  5. Establecer puertos abiertos: 22 (SSH) y 7007 (visor web Viser).

  6. Haz clic Alquilar y espera a que la instancia se inicialice.

circle-info

El dromni/nerfstudio la imagen es la imagen oficial mantenida por la comunidad e incluye todas las dependencias preinstaladas (CUDA, tiny-cuda-nn, colmap, ffmpeg).


Paso 2 — Conéctate vía SSH

circle-info

El dromni/nerfstudio la imagen utiliza usuario (no root) por defecto. Usa sudo para tareas administrativas.

Verifica la instalación:


Paso 3 — Prepara tu conjunto de datos

Opción A: Usa el conjunto de datos de ejemplo proporcionado

Nerfstudio incluye conjuntos de datos integrados para probar de inmediato:

Opción B: Procesa tus propias imágenes

Si tienes fotos o video de tu escena:

A partir de imágenes (pipeline COLMAP):

A partir de video:

circle-info

Para mejores resultados, usa 100–300 fotos con solapamiento significativo (>60% entre fotogramas adyacentes). Camina alrededor del objeto/escena en un patrón sistemático: círculos, cuadrículas o ochos funcionan bien.


Paso 4 — Entrena un NeRF

Entrenamiento básico con Nerfacto (Recomendado)

Nerfacto es el método insignia de Nerfstudio, equilibrando calidad y velocidad:

Entrenamiento con Instant-NGP (El más rápido)

Entrenamiento con el conjunto de datos poster proporcionado


Paso 5 — Accede al visor interactivo

Abra su navegador y navegue a:

Verás un visor 3D impulsado por Viser que muestra:

  • Progreso de entrenamiento en vivo

  • Calidad de renderizado NeRF actual

  • Controles de cámara interactivos

  • Curvas de pérdida del entrenamiento

circle-info

El visor se actualiza cada pocos segundos durante el entrenamiento. Puedes rotar, desplazar y hacer zoom para inspeccionar la calidad de la escena a medida que avanza el entrenamiento.


Métodos de entrenamiento disponibles

Método
Velocidad
Calidad
VRAM
Notas

nerfacto

Medio

Alta

8 GB

Mejor en general

instant-ngp

Rápido

Medio

6 GB

Entrenamiento más rápido

splatfacto

Rápido

Alta

8 GB

Gaussian splatting

tensorf

Medio

Alta

12 GB

Bueno para objetos

mipnerf360

Lento

Muy alto

24 GB

Mejor calidad

vanilla-nerf

Muy lento

Alta

16 GB

Línea base de investigación

Entrenamiento con Splatfacto (Gaussian Splatting)


Paso 6 — Evaluar y renderizar

Revisa las métricas de entrenamiento

Renderizar un recorrido en video

Renderizar espiral interpolada


Paso 7 — Exportar geometría 3D

Exportar nube de puntos

Exportar malla

Exportar Gaussian Splats (PLY)


API de Python

Para entrenamiento y evaluación programática:


Consejos para conjuntos de datos personalizados

Buenas prácticas de captura con la cámara

Ajuste
Recomendación

Solapamiento

≥ 60% entre fotogramas

Imágenes

100–300 (exteriores), 50–150 (objetos)

Movimiento

Movimiento lento y constante

Iluminación

Consistente, evita sombras duras

Enfoque

Nítido en todo momento

Mejorando los resultados de COLMAP


Solución de problemas

COLMAP no encuentra las poses de cámara

Soluciones:

  • Asegúrate de que las imágenes tengan suficiente solapamiento

  • Verifica que las imágenes estén nítidas (sin desenfoque por movimiento)

  • Prueba el matching exhaustivo: --matching-method exhaustive

  • Reducir --num-frames-target para video, para seleccionar mejores fotogramas

Visor no accesible

Solución: Asegúrate de que el puerto 7007 esté reenviado en Clore.ai. Prueba la conectividad:

La pérdida de entrenamiento no disminuye

Soluciones:

  • Comprueba que COLMAP tuvo éxito (busca transforms.json en el directorio de salida)

  • Reduce la tasa de aprendizaje: --pipeline.model.field-implementation hash

  • Comprueba si hay cielo dominante (usa --pipeline.model.background-color white)

Falta de memoria


Descargar salidas

Después del entrenamiento, descarga tus renders y exportaciones:


Estimación de Costos

GPU
VRAM
Precio estimado
Escena de 100 imágenes

RTX 3080

10 GB

~$0.10/hr

~30–45 min

RTX 4090

24 GB

~$0.35/hr

~10–15 min

A100 40GB

40 GB

~$0.80/hr

~5–8 min

circle-info

Comienza con Instant-NGP para vistas previas rápidas, luego cambia a Nerfacto o MipNeRF360 para la calidad final. Este flujo de trabajo ahorra un coste computacional significativo.


Recursos Útiles


Recomendaciones de GPU en Clore.ai

Caso de uso
GPU recomendada
Coste estimado en Clore.ai

Desarrollo/Pruebas

RTX 3090 (24GB)

~$0.12/gpu/hr

Producción

RTX 4090 (24GB)

~$0.70/gpu/hr

Escenas a gran escala / alta resolución

A100 80GB

~$1.20/gpu/hr

💡 Todos los ejemplos en esta guía pueden desplegarse en Clore.aiarrow-up-right servidores GPU. Navega las GPUs disponibles y alquila por hora — sin compromisos, acceso root completo.

Última actualización

¿Te fue útil?