# yaml-language-server: $schema=https://schema.zeabur.app/template.json
apiVersion: zeabur.com/v1
kind: Template
metadata:
    name: Docling
spec:
    description: |
        Docling is a document parsing API by IBM Research that converts PDF, DOCX, PPTX, HTML, and images into structured Markdown or JSON. Features an interactive Swagger UI for testing conversions. Stateless API — no external database required.
    coverImage: https://raw.githubusercontent.com/DS4SD/docling/main/docs/assets/docling_processing.png
    icon: https://avatars.githubusercontent.com/u/152441932
    variables:
        - key: PUBLIC_DOMAIN
          type: DOMAIN
          name: Domain
          description: The domain to access Docling API
    tags:
        - Tool
        - AI
    readme: |
        # Docling

        A document parsing API by IBM Research. Converts PDF, DOCX, PPTX, HTML, images, and AsciiDoc into structured Markdown or JSON with high fidelity. Powered by AI models for layout analysis and table structure recognition.

        ## What You Can Do After Deployment

        1. **Visit your domain** — the Swagger UI loads at `/docs` for interactive API testing
        2. **Convert PDFs** — upload PDF files and get structured Markdown or JSON output
        3. **Process DOCX/PPTX** — convert Office documents with preserved structure
        4. **Extract tables** — AI-powered table structure recognition with cell-level accuracy
        5. **Batch processing** — convert multiple documents via the API
        6. **OCR support** — extract text from scanned documents and images
        7. **Integrate via API** — use the REST API from any programming language

        ## API Example

        ```bash
        curl -X POST "https://YOUR_DOMAIN/v1/convert/source" \
          -F "file=@document.pdf" \
          -H "accept: application/json"
        ```

        ## Key Features

        - PDF, DOCX, PPTX, HTML, image, AsciiDoc input support
        - Markdown and JSON output formats
        - AI-powered layout analysis (DocLayNet)
        - Table structure recognition (TableFormer)
        - OCR for scanned documents
        - Metadata extraction
        - Stateless — no database needed

        ## License

        MIT — [GitHub](https://github.com/DS4SD/docling)
    services:
        - name: docling
          icon: https://avatars.githubusercontent.com/u/152441932
          template: PREBUILT_V2
          spec:
            source:
                image: ghcr.io/docling-project/docling-serve:v1.15.0
            ports:
                - id: web
                  port: 5001
                  type: HTTP
            env:
                TZ:
                    default: UTC
            healthCheck:
                type: HTTP
                port: web
                http:
                    path: /health
          domainKey: PUBLIC_DOMAIN
localization:
    es-ES:
        description: |
            Docling es una API de analisis de documentos de IBM Research que convierte PDF, DOCX, PPTX, HTML e imagenes en Markdown o JSON estructurado. Incluye Swagger UI. Sin base de datos externa necesaria.
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: Dominio
              description: El dominio para acceder a la API de Docling
        readme: |
            # Docling

            API de analisis de documentos de IBM Research. Convierte PDF, DOCX, PPTX, HTML e imagenes en Markdown o JSON estructurado.

            ## Que puedes hacer despues del despliegue

            1. **Visita tu dominio** — Swagger UI se carga en `/docs`
            2. **Convierte PDFs** — sube archivos PDF y obtiene salida estructurada
            3. **Procesa DOCX/PPTX** — convierte documentos Office preservando la estructura
            4. **Extrae tablas** — reconocimiento de estructura de tablas con IA
            5. **Procesamiento por lotes** — convierte multiples documentos via API
            6. **Soporte OCR** — extrae texto de documentos escaneados e imagenes

            ## Licencia

            MIT — [GitHub](https://github.com/DS4SD/docling)
    id-ID:
        description: |
            Docling adalah API parsing dokumen dari IBM Research yang mengonversi PDF, DOCX, PPTX, HTML, dan gambar menjadi Markdown atau JSON terstruktur. Dilengkapi Swagger UI. Tanpa database eksternal.
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: Domain
              description: Domain untuk mengakses Docling API
        readme: |
            # Docling

            API parsing dokumen dari IBM Research. Mengonversi PDF, DOCX, PPTX, HTML, gambar menjadi Markdown atau JSON terstruktur.

            ## Apa yang bisa dilakukan setelah deploy

            1. **Buka domain** — Swagger UI tampil di `/docs`
            2. **Konversi PDF** — upload file PDF dan dapatkan output terstruktur
            3. **Proses DOCX/PPTX** — konversi dokumen Office dengan struktur terjaga
            4. **Ekstrak tabel** — pengenalan struktur tabel berbasis AI
            5. **Pemrosesan batch** — konversi beberapa dokumen melalui API
            6. **Dukungan OCR** — ekstrak teks dari dokumen scan dan gambar

            ## Lisensi

            MIT — [GitHub](https://github.com/DS4SD/docling)
    ja-JP:
        description: |
            Docling は IBM Research によるドキュメント解析 API です。PDF、DOCX、PPTX、HTML、画像を構造化された Markdown や JSON に変換。Swagger UI 内蔵。外部データベース不要。
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: ドメイン
              description: Docling API にアクセスするためのドメイン
        readme: |
            # Docling

            IBM Research によるドキュメント解析 API。PDF、DOCX、PPTX、HTML、画像を構造化された Markdown や JSON に変換。

            ## デプロイ後にできること

            1. **ドメインにアクセス** — `/docs` パスで Swagger UI が表示されます
            2. **PDF 変換** — PDF をアップロードして構造化出力を取得
            3. **DOCX/PPTX 処理** — Office ドキュメントを構造を保持して変換
            4. **テーブル抽出** — AI によるテーブル構造認識
            5. **バッチ処理** — API で複数ドキュメントを変換
            6. **OCR サポート** — スキャンドキュメントと画像からテキスト抽出

            ## ライセンス

            MIT — [GitHub](https://github.com/DS4SD/docling)
    ko-KR:
        description: |
            Docling은 IBM Research의 문서 파싱 API로, PDF, DOCX, PPTX, HTML, 이미지를 구조화된 Markdown 또는 JSON으로 변환합니다. Swagger UI 내장. 외부 데이터베이스 불필요.
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: 도메인
              description: Docling API에 접속할 도메인
        readme: |
            # Docling

            IBM Research의 문서 파싱 API. PDF, DOCX, PPTX, HTML, 이미지를 구조화된 Markdown 또는 JSON으로 변환.

            ## 배포 후 할 수 있는 것

            1. **도메인 접속** — `/docs` 경로에서 Swagger UI 로드
            2. **PDF 변환** — PDF 업로드 후 구조화된 출력 획득
            3. **DOCX/PPTX 처리** — Office 문서를 구조를 유지하며 변환
            4. **테이블 추출** — AI 기반 테이블 구조 인식
            5. **배치 처리** — API로 여러 문서 변환
            6. **OCR 지원** — 스캔 문서 및 이미지에서 텍스트 추출

            ## 라이선스

            MIT — [GitHub](https://github.com/DS4SD/docling)
    th-TH:
        description: |
            Docling เป็น API แยกวิเคราะห์เอกสารจาก IBM Research ที่แปลง PDF, DOCX, PPTX, HTML และรูปภาพเป็น Markdown หรือ JSON แบบมีโครงสร้าง มี Swagger UI ในตัว ไม่ต้องการฐานข้อมูลภายนอก
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: โดเมน
              description: โดเมนสำหรับเข้าถึง Docling API
        readme: |
            # Docling

            API แยกวิเคราะห์เอกสารจาก IBM Research แปลง PDF, DOCX, PPTX, HTML, รูปภาพเป็น Markdown หรือ JSON แบบมีโครงสร้าง

            ## สิ่งที่ทำได้หลังจากติดตั้ง

            1. **เข้าสู่โดเมน** — Swagger UI โหลดที่ `/docs`
            2. **แปลง PDF** — อัปโหลดไฟล์ PDF และรับผลลัพธ์แบบมีโครงสร้าง
            3. **ประมวลผล DOCX/PPTX** — แปลงเอกสาร Office โดยคงโครงสร้างไว้
            4. **ดึงตาราง** — การรู้จำโครงสร้างตารางด้วย AI
            5. **ประมวลผลแบบ batch** — แปลงหลายเอกสารผ่าน API
            6. **รองรับ OCR** — ดึงข้อความจากเอกสารสแกนและรูปภาพ

            ## สัญญาอนุญาต

            MIT — [GitHub](https://github.com/DS4SD/docling)
    zh-CN:
        description: |
            Docling 是 IBM Research 开发的文档解析 API，可将 PDF、DOCX、PPTX、HTML 与图片转换为结构化的 Markdown 或 JSON。内置 Swagger UI 进行交互式测试。无状态 API，无需外部数据库。
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: 域名
              description: 访问 Docling API 的域名
        readme: |
            # Docling

            IBM Research 开发的文档解析 API。将 PDF、DOCX、PPTX、HTML、图片转换为结构化的 Markdown 或 JSON。

            ## 部署后可以做什么

            1. **打开域名** — Swagger UI 在 `/docs` 路径加载
            2. **转换 PDF** — 上传 PDF 文件获取结构化输出
            3. **处理 DOCX/PPTX** — 转换 Office 文档并保留结构
            4. **提取表格** — AI 驱动的表格结构识别
            5. **批量处理** — 通过 API 转换多个文档
            6. **OCR 支持** — 从扫描文档和图片中提取文字

            ## 授权

            MIT — [GitHub](https://github.com/DS4SD/docling)
    zh-TW:
        description: |
            Docling 是 IBM Research 開發的文件解析 API，可將 PDF、DOCX、PPTX、HTML 與圖片轉換為結構化的 Markdown 或 JSON。內建 Swagger UI 進行互動式測試。無狀態 API，不需要外部資料庫。
        variables:
            - key: PUBLIC_DOMAIN
              type: STRING
              name: 網域
              description: 存取 Docling API 的網域
        readme: |
            # Docling

            IBM Research 開發的文件解析 API。將 PDF、DOCX、PPTX、HTML、圖片轉換為結構化的 Markdown 或 JSON，採用 AI 模型進行版面分析與表格辨識。

            ## 部署後可以做什麼

            1. **開啟網域** — Swagger UI 在 `/docs` 路徑載入，可進行互動式 API 測試
            2. **轉換 PDF** — 上傳 PDF 檔案，取得結構化的 Markdown 或 JSON 輸出
            3. **處理 DOCX/PPTX** — 轉換 Office 文件並保留結構
            4. **擷取表格** — AI 驅動的表格結構辨識，具備儲存格級別的準確度
            5. **批次處理** — 透過 API 轉換多個文件
            6. **OCR 支援** — 從掃描文件和圖片中擷取文字
            7. **API 整合** — 從任何程式語言使用 REST API

            ## 主要功能

            - 支援 PDF、DOCX、PPTX、HTML、圖片輸入
            - Markdown 和 JSON 輸出格式
            - AI 版面分析（DocLayNet）
            - 表格結構辨識（TableFormer）
            - 掃描文件 OCR
            - 無狀態，不需要資料庫

            ## 授權

            MIT — [GitHub](https://github.com/DS4SD/docling)
