Docling
API parsing dokumen dari IBM Research. Mengonversi PDF, DOCX, PPTX, HTML, gambar menjadi Markdown atau JSON terstruktur.
Apa yang bisa dilakukan setelah deploy
- Buka domain — Swagger UI tampil di
/docs
- Konversi PDF — upload file PDF dan dapatkan output terstruktur
- Proses DOCX/PPTX — konversi dokumen Office dengan struktur terjaga
- Ekstrak tabel — pengenalan struktur tabel berbasis AI
- Pemrosesan batch — konversi beberapa dokumen melalui API
- Dukungan OCR — ekstrak teks dari dokumen scan dan gambar
Lisensi
MIT — GitHub