Promptfoo
開源 LLM 測試與評估框架。比較不同模型的提示品質、偵測回歸,並執行紅隊安全評估。
部署後可以做什麼
- 開啟網域 — Promptfoo Web UI 立即載入
- 建立評估 — 定義測試案例,跨模型比較輸出
- 執行紅隊評估 — 自動探測提示注入和越獄漏洞
- 查看結果 — 並排比較表格與通過/失敗評分
- 匯出報告 — 與團隊分享評估結果
使用場景
- 提示工程和 A/B 測試
- 模型選擇和基準測試
- LLM 安全與紅隊演練
- CI/CD 提示回歸測試整合
- 跨供應商成本與延遲比較
授權
MIT — GitHub