# 概览

用于在 GPU 基础设施上管理 ML 工作流的机器学习运维工具和平台。

MLOps 将机器学习与 DevOps 实践相结合，以简化模型开发、部署和监控。本类别涵盖流行的 MLOps 平台，帮助团队从实验到生产部署管理整个 ML 生命周期。

将全面的 ML 平台和模型服务解决方案部署到 CLORE.AI GPU 上，以加速您的机器学习工作流、跟踪实验，并在 Clore.ai 市场规模化地提供模型服务。

## 可用指南

| 指南                                                                                                | 用例           | 难度 |
| ------------------------------------------------------------------------------------------------- | ------------ | -- |
| [BentoML](https://docs.clore.ai/guides/guides_v2-zh/mlops-yu-bu-shu/bentoml)                      | 模型服务平台       | 中等 |
| [ClearML](https://docs.clore.ai/guides/guides_v2-zh/mlops-yu-bu-shu/clearml)                      | 完整的 MLOps 平台 | 中等 |
| [MLflow](https://docs.clore.ai/guides/guides_v2-zh/mlops-yu-bu-shu/mlflow)                        | 实验跟踪与模型管理    | 简单 |
| [Triton 推理服务器](https://docs.clore.ai/guides/guides_v2-zh/mlops-yu-bu-shu/triton-inference-server) | 高性能模型服务      | 高级 |

## 平台比较

| 平台      | 最佳用途           | GPU 支持 |
| ------- | -------------- | ------ |
| BentoML | 模型服务           | 优秀     |
| ClearML | 完整的 MLOps 生命周期 | 优秀     |
| MLflow  | 实验跟踪           | 良好     |
| Triton  | 高吞吐量推理         | 优秀     |

## MLOps 工作流

1. **实验** - 使用 MLflow/ClearML 跟踪
2. **训练** - 使用 GPU 实例进行模型训练
3. **服务** - 使用 BentoML/Triton 部署
4. **监控** - 跟踪性能和漂移

## 相关指南

* [训练与微调](https://docs.clore.ai/guides/guides_v2-zh/xun-lian/training)
* [语言模型](https://docs.clore.ai/guides/guides_v2-zh/yu-yan-mo-xing/language-models)
