#018 AI/ML 模型管理

DVC

資料版本控制

★★★☆☆ 難度 3/5

Git 整合的資料與模型版本控制工具,100% 開源免費

目標使用者
中級進階
定價
開源免費 / Studio $20/user/mo
官方網站
dvc.org ↗

工具介紹

DVC(Data Version Control)是 Git 的 ML 延伸工具,讓資料集、模型和實驗能像程式碼一樣進行版本控制。 透過與 Git 的深度整合,DVC 讓團隊能追蹤資料集變更歷史、重現任意實驗結果,並在不同儲存後端(S3/GCS/Azure)間同步大型資料。 適合重視可重現性、希望將 ML 工作流納入 DevOps 標準流程的技術型 PM 和資料團隊。

核心功能

  • Git 整合資料版本控制
  • 實驗可重現性管理
  • 多雲端儲存後端支援
  • CI/CD 管道整合
  • DVC Studio 視覺化介面

適用情境

  • ML 訓練資料版本管理
  • 實驗可重現性確保
  • 資料科學 CI/CD 流程
#version-control #open-source #mlops

相關工具