Nerfstudio

Nerfstudio — модульный, ориентированный на исследователей фреймворк для обучения и рендеринга Нейронных полей излучения (NeRF) — методики, восстанавливающей фотореалистичные 3D-сцены из 2D-изображений. С более чем 10 000 звёзд на GitHub, он стал де-факто стандартом для исследований NeRF и промышленных приложений. Запускайте его в GPU-облаке Clore.ai, чтобы восстанавливать 3D-сцены по собственным фото или видео.


Что такое Nerfstudio?

NeRF (Neural Radiance Field) представляет 3D-сцену в виде нейронной сети, которая, получив позицию и направление камеры, выдаёт цвет и плотность в данной точке. Обучаясь на десятках фотографий, снятых с разных углов, NeRF усваивает полное 3D-представление, которое можно отрисовать с любой точки зрения.

Nerfstudio предоставляет:

  • Несколько методов NeRF: Nerfacto, Instant-NGP, Splatfacto, TensoRF и другие

  • CLI и Python API

  • Интерактивный веб-просмотрщик (Viser) на порту 7007

  • Экспорт в облака точек, меши и видео-пролетные кадры

  • Поддержку пользовательских наборов данных через интеграцию с COLMAP

Сценарии использования:

  • Восстановление 3D-сцен из съёмки с дронов

  • Визуализация продуктов по фотографиям

  • Виртуальные туры из съёмок со смартфона

  • Исследования по синтезу новых видов


Требования

Требование
Минимум
Рекомендуется

VRAM GPU

8 ГБ

16–24 ГБ

GPU

RTX 3080

RTX 4090 / A100

ОЗУ

16 ГБ

32 ГБ

Хранилище

20 ГБ

50+ ГБ

CUDA

11.8+

12.1+

circle-info

Время обучения масштабируется с сложностью сцены. Типичная уличная сцена из 100 фото обучается за 10–30 минут на RTX 4090. Интерактивный просмотрщик обновляется в реальном времени во время обучения.


Шаг 1 — Арендуйте GPU на Clore.ai

  1. Войдите в clore.aiarrow-up-right.

  2. Нажмите Маркетплейс и отфильтруйте по видеопамяти VRAM ≥ 16 ГБ.

  3. Выберите сервер — RTX 4090 идеален для Nerfstudio.

  4. Установите Docker-образ: dromni/nerfstudio:latest

  5. Установите открытые порты: 22 (SSH) и 7007 (веб-просмотрщик Viser).

  6. Нажмите Арендовать и дождитесь инициализации инстанса.

circle-info

Параметр dromni/nerfstudio образ — это поддерживаемый сообществом официальный образ и включает все предустановленные зависимости (CUDA, tiny-cuda-nn, colmap, ffmpeg).


Шаг 2 — Подключение по SSH

circle-info

Параметр dromni/nerfstudio образ использует пользователя (не root) по умолчанию. Используйте sudo для административных задач.

Проверьте установку:


Шаг 3 — Подготовьте ваш набор данных

Вариант A: Использовать предоставленный пример набора данных

Nerfstudio включает встроенные наборы данных для немедленного тестирования:

Вариант B: Обработайте собственные изображения

Если у вас есть фотографии или видео сцены:

Из изображений (пайплайн COLMAP):

Из видео:

circle-info

Для лучших результатов используйте 100–300 фотографий с существенным перекрытием (>60% между смежными кадрами). Обходите объект/сцену систематически — кругами, по сетке или «восьмёркой» — это хорошо работает.


Шаг 4 — Обучите NeRF

Базовое обучение с Nerfacto (рекомендуется)

Nerfacto — флагманский метод Nerfstudio, балансирующий качество и скорость:

Обучение с Instant-NGP (самое быстрое)

Обучение с предоставленным набором poster


Шаг 5 — Доступ к интерактивному просмотровщику

Откройте браузер и перейдите по адресу:

Вы увидите 3D-просмотрщик, работающий на Viser который показывает:

  • Ход обучения в реальном времени

  • Текущее качество рендеринга NeRF

  • Интерактивные элементы управления камерой

  • Графики потерь обучения

circle-info

Просмотрщик обновляется каждые несколько секунд во время обучения. Вы можете вращать, панорамировать и приближать, чтобы инспектировать качество сцены по мере обучения.


Доступные методы обучения

Метод
Скорость
Качество
VRAM
Примечания

nerfacto

Средне

Высокая

8 ГБ

Лучший универсальный

instant-ngp

Быстро

Средне

6 ГБ

Самое быстрое обучение

splatfacto

Быстро

Высокая

8 ГБ

Gaussian splatting

tensorf

Средне

Высокая

12 ГБ

Хорош для объектов

mipnerf360

Медленно

Очень высокое

24 ГБ

Лучшее качество

vanilla-nerf

Очень медленный

Высокая

16 ГБ

Базовый метод для исследований

Обучение с Splatfacto (Gaussian Splatting)


Шаг 6 — Оценка и рендеринг

Проверьте метрики обучения

Отрендерьте видео-пролёт

Рендер интерполированной спирали


Шаг 7 — Экспорт 3D-геометрии

Экспорт облака точек

Экспорт меша

Экспорт Gaussian Splats (PLY)


Python API

Для программного обучения и оценки:


Советы по пользовательским наборам данных

Рекомендации по съёмке камерой

Параметр
Рекомендация

Перекрытие

≥ 60% между кадрами

Изображения

100–300 (на улице), 50–150 (объекты)

Движение

Медленное, равномерное движение

Освещение

Постоянное, избегайте резких теней

Фокус

Резкое по всей сцене

Улучшение результатов COLMAP


Устранение неполадок

COLMAP не находит позы камер

Решения:

  • Убедитесь, что у изображений достаточное перекрытие

  • Проверьте, что изображения резкие (без смаза движения)

  • Попробуйте exhaustive matching: --matching-method exhaustive

  • Уменьшите --num-frames-target для видео — чтобы выбрать лучшие кадры

Просмотрщик недоступен

Решение: Убедитесь, что порт 7007 проброшен в Clore.ai. Проверьте подключение:

Потеря обучения не уменьшается

Решения:

  • Проверьте, успешно ли прошёл COLMAP (ищите transforms.json в выходной директории)

  • Уменьшите скорость обучения: --pipeline.model.field-implementation hash

  • Проверьте наличие доминирующего неба (используйте --pipeline.model.background-color white)

Недостаточно памяти


Загрузите результаты

После обучения скачайте ваши рендеры и экспорты:


Оценка стоимости

GPU
VRAM
Примерная цена
Сцена из 100 изображений

RTX 3080

10 ГБ

~$0.10/час

~30–45 мин

RTX 4090

24 ГБ

~$0.35/час

~10–15 мин

A100 40GB

40 ГБ

~$0.80/час

~5–8 мин

circle-info

Начните с Instant-NGP для быстрых превью, затем переключитесь на Nerfacto или MipNeRF360 для финального качества. Такой рабочий процесс экономит значительные вычислительные ресурсы.


Полезные ресурсы


Рекомендации Clore.ai по GPU

Сценарий использования
Рекомендуемый GPU
Примерная стоимость на Clore.ai

Разработка/Тестирование

RTX 3090 (24GB)

~$0.12/gpu/hr

Продакшн

RTX 4090 (24GB)

~$0.70/gpu/hr

Крупномасштабные / высокоразрешённые сцены

A100 80GB

~$1.20/gpu/hr

💡 Все примеры в этом руководстве можно развернуть на Clore.aiarrow-up-right GPU-серверах. Просматривайте доступные GPU и арендуйте по часам — без обязательств, с полным root-доступом.

Последнее обновление

Это было полезно?