Docling
IBM Research 開發的文件解析 API。將 PDF、DOCX、PPTX、HTML、圖片轉換為結構化的 Markdown 或 JSON,採用 AI 模型進行版面分析與表格辨識。
部署後可以做什麼
- 開啟網域 — Swagger UI 在
/docs 路徑載入,可進行互動式 API 測試
- 轉換 PDF — 上傳 PDF 檔案,取得結構化的 Markdown 或 JSON 輸出
- 處理 DOCX/PPTX — 轉換 Office 文件並保留結構
- 擷取表格 — AI 驅動的表格結構辨識,具備儲存格級別的準確度
- 批次處理 — 透過 API 轉換多個文件
- OCR 支援 — 從掃描文件和圖片中擷取文字
- API 整合 — 從任何程式語言使用 REST API
主要功能
- 支援 PDF、DOCX、PPTX、HTML、圖片輸入
- Markdown 和 JSON 輸出格式
- AI 版面分析(DocLayNet)
- 表格結構辨識(TableFormer)
- 掃描文件 OCR
- 無狀態,不需要資料庫
授權
MIT — GitHub