#018 AI/ML 模型管理
DVC
資料版本控制
★★★☆☆ 難度 3/5
Git 整合的資料與模型版本控制工具,100% 開源免費
工具介紹
DVC(Data Version Control)是 Git 的 ML 延伸工具,讓資料集、模型和實驗能像程式碼一樣進行版本控制。
透過與 Git 的深度整合,DVC 讓團隊能追蹤資料集變更歷史、重現任意實驗結果,並在不同儲存後端(S3/GCS/Azure)間同步大型資料。
適合重視可重現性、希望將 ML 工作流納入 DevOps 標準流程的技術型 PM 和資料團隊。
核心功能
- ✓ Git 整合資料版本控制
- ✓ 實驗可重現性管理
- ✓ 多雲端儲存後端支援
- ✓ CI/CD 管道整合
- ✓ DVC Studio 視覺化介面
適用情境
- ● ML 訓練資料版本管理
- ● 實驗可重現性確保
- ● 資料科學 CI/CD 流程
#version-control
#open-source
#mlops