Docling

Docling 是 IBM Research 開發的文件解析 API，可將 PDF、DOCX、PPTX、HTML 與圖片轉換為結構化的 Markdown 或 JSON。內建 Swagger UI 進行互動式測試。無狀態 API，不需要外部資料庫。

template cover

部署次數0 次

發布者futurize.rush

建立於2026-03-31

原始碼查看原始碼

標籤

ToolAI

模板內的服務

docling

ghcr.io/docling-project/docling-serve:v1.15.0

Docling

IBM Research 開發的文件解析 API。將 PDF、DOCX、PPTX、HTML、圖片轉換為結構化的 Markdown 或 JSON，採用 AI 模型進行版面分析與表格辨識。

部署後可以做什麼

開啟網域 — Swagger UI 在 /docs 路徑載入，可進行互動式 API 測試
轉換 PDF — 上傳 PDF 檔案，取得結構化的 Markdown 或 JSON 輸出
處理 DOCX/PPTX — 轉換 Office 文件並保留結構
擷取表格 — AI 驅動的表格結構辨識，具備儲存格級別的準確度
批次處理 — 透過 API 轉換多個文件
OCR 支援 — 從掃描文件和圖片中擷取文字
API 整合 — 從任何程式語言使用 REST API

主要功能

支援 PDF、DOCX、PPTX、HTML、圖片輸入
Markdown 和 JSON 輸出格式
AI 版面分析（DocLayNet）
表格結構辨識（TableFormer）
掃描文件 OCR
無狀態，不需要資料庫

授權

MIT — GitHub

部署次數0 次

發布者futurize.rush

建立於2026-03-31

原始碼查看原始碼

標籤

ToolAI

模板內的服務

docling

ghcr.io/docling-project/docling-serve:v1.15.0