#083 AI 部署與 MLOps

Evidently AI

Evidently AI 模型監控評估

★★★☆☆ 難度 3/5

開源模型監控與 LLM 品質評估的 MLOps 工具

目標使用者
中級進階
定價
開源免費 / Cloud 版本收費

工具介紹

Evidently AI 是廣受歡迎的開源 ML 監控框架,提供資料品質、資料漂移、模型效能衰退等各種評估報告,幫助團隊即時發現生產模型出現的問題。近年來 Evidently 大幅擴展對 LLM 評估的支援,提供幻覺偵測、回應相關性、毒性內容等評估指標,成為 LLMOps 的重要工具。平台提供 Python SDK 讓工程師輕鬆整合進現有 ML Pipeline,也提供視覺化儀表板讓非技術人員監控模型健康狀態。對於構建 RAG 或 LLM 應用的 AI PM,Evidently 的 LLM 評估指標能直接反映產品品質。

核心功能

  • 資料漂移與模型效能衰退自動偵測
  • LLM 輸出品質評估(幻覺、相關性、毒性)
  • 互動式 HTML 報告與視覺化儀表板
  • Python SDK 整合進 ML Pipeline
  • 支援 Batch 評估與即時監控兩種模式

適用情境

  • 監控生產 ML 模型,當資料分佈改變時自動告警
  • 評估 RAG 系統的回應品質,追蹤 LLM 幻覺率
  • 定期產出模型健康報告,確保 AI 產品品質穩定
  • 比較模型更新前後的效能變化,決策是否上線新版本
#模型監控 #llmops #開源

相關工具