logo
icon

Docling

Docling 是 IBM Research 開發的文件解析 API,可將 PDF、DOCX、PPTX、HTML 與圖片轉換為結構化的 Markdown 或 JSON。內建 Swagger UI 進行互動式測試。無狀態 API,不需要外部資料庫。

template cover
部署次數0
發布者futurize.rush
建立於2026-03-31
模板內的服務
service icon
標籤
ToolAI

Docling

IBM Research 開發的文件解析 API。將 PDF、DOCX、PPTX、HTML、圖片轉換為結構化的 Markdown 或 JSON,採用 AI 模型進行版面分析與表格辨識。

部署後可以做什麼

  1. 開啟網域 — Swagger UI 在 /docs 路徑載入,可進行互動式 API 測試
  2. 轉換 PDF — 上傳 PDF 檔案,取得結構化的 Markdown 或 JSON 輸出
  3. 處理 DOCX/PPTX — 轉換 Office 文件並保留結構
  4. 擷取表格 — AI 驅動的表格結構辨識,具備儲存格級別的準確度
  5. 批次處理 — 透過 API 轉換多個文件
  6. OCR 支援 — 從掃描文件和圖片中擷取文字
  7. API 整合 — 從任何程式語言使用 REST API

主要功能

  • 支援 PDF、DOCX、PPTX、HTML、圖片輸入
  • Markdown 和 JSON 輸出格式
  • AI 版面分析(DocLayNet)
  • 表格結構辨識(TableFormer)
  • 掃描文件 OCR
  • 無狀態,不需要資料庫

授權

MIT — GitHub