Docling
IBM Research によるドキュメント解析 API。PDF、DOCX、PPTX、HTML、画像を構造化された Markdown や JSON に変換。
デプロイ後にできること
- ドメインにアクセス —
/docs パスで Swagger UI が表示されます
- PDF 変換 — PDF をアップロードして構造化出力を取得
- DOCX/PPTX 処理 — Office ドキュメントを構造を保持して変換
- テーブル抽出 — AI によるテーブル構造認識
- バッチ処理 — API で複数ドキュメントを変換
- OCR サポート — スキャンドキュメントと画像からテキスト抽出
ライセンス
MIT — GitHub