logo
icon

Firecrawl

AI アプリケーション、ナレッジベース、データパイプライン向けのオープンソース Web クローラー / スクレイピング API。

AI アプリケーション、ナレッジベース、データパイプライン向けのオープンソース Web クローラー / スクレイピング API。

プラットフォームZeabur
展開済み2
発行者zeaburZeabur

Firecrawl

🚀 Firecrawl は AI アプリケーション、ナレッジベース、データパイプライン向けのオープンソース Web クローラー / スクレイピング API です。

このテンプレートはセルフホスト版 Firecrawl のフルスタックをデプロイします:

  • api — Firecrawl のメインプロセス。harness.js --start-docker を実行し、同一コンテナ内で API サーバー、worker、extract-worker、複数の NUQ キュー worker サブプロセスを管理します。
  • playwright — JavaScript レンダリングページ向けのブラウザ自動化マイクロサービス。
  • redis — キャッシュとレート制限用のストア。
  • rabbitmq — NUQ タスクキューのブローカー。
  • postgres — Postgres 17 + pg_cron、NUQ キュースキーマをプリロード済み。

リソース推奨値

Firecrawl はリソース集約型のサービスです。upstream の docker-compose.yamlapi に最低 4 vCPU / 8 GB RAMplaywright に最低 2 vCPU / 4 GB RAM を推奨しています。Pro プランまたは専用サーバーへのデプロイを推奨します。

設定

必須項目はドメイン名のみです。デプロイフォームには Zeabur AI Hub API Key のオプション欄があり、Generate をクリックすればその場でキーを発行できます。api コンテナは初回起動時に自動的に AI Hub を使うように設定されます(OPENAI_BASE_URL=https://hnd1.aihub.zeabur.ai/v1MODEL_NAME=claude-sonnet-4-5)。AI Hub は Zeabur のクレジットから直接課金されるため、別途 OpenAI のサインアップは不要です。

OpenAI 以外のプロバイダ(OpenAI 直接、OpenRouter、xAI、Ollama …)を使う場合: デプロイ時に AI Hub 欄を空のままにし、デプロイ完了後に api サービスの env タブで OPENAI_API_KEY(必要に応じて OPENAI_BASE_URLMODEL_NAME)を設定してください。auto-config はデプロイ時に AI Hub を選択した場合のみ作動するため、ユーザーが設定した値は上書きされません。サポートされる変数の完全なリストは apps/api/src/config.ts を参照してください。

AI Hub でデプロイ済みで後から切り替えたい場合: api サービスの env タブに OPENAI_API_KEY(自前のキー)を設定して api サービスを再起動するだけです。wrapper はユーザー設定値を検知し、AI Hub auto-config をスキップします。

AI Hub で運用する際の注意点:

  • AI Hub は現在 embedding model を提供していません。Crawl のリンク関連度ランキングは「ランキングなし」にフォールバックしますが、その他の LLM 機能(extract、agent、summary)には影響しません。
  • 一部の Firecrawl 機能(インタラクティブ browser-agent、direct-quote 処理)は OPENAI_BASE_URL を経由せず、@ai-sdk/google 経由で直接 Google Gemini を呼び出します。これらを有効化するには、api サービスに GOOGLE_GENERATIVE_AI_API_KEY も設定してください。

BULL_AUTH_KEY(内蔵 Bull queue dashboard を保護する認証キー)は自動生成されます。api サービスの env タブから確認できます。

API 認証はデフォルトで 無効 です(USE_DB_AUTHENTICATION=false)。API エンドポイントは公開状態のため、インターネットに公開する場合は Cloudflare、認証プロキシ、ネットワーク ACL などでドメインを保護してください。

クイックテスト

デプロイ完了後、scrape エンドポイントを呼び出します:

curl -X POST https://<your-domain>/v1/scrape \
  -H 'Content-Type: application/json' \
  -d '{"url": "https://docs.firecrawl.dev"}'

キュー管理ダッシュボード

Firecrawl にはエンドユーザー向け UI はなく、API のみのサービスです。運用者向けに Bull Dashboard が組み込まれており、以下の URL でアクセスできます:

https://<your-domain>/admin/<BULL_AUTH_KEY>/queues

キューのスループット監視、active / completed / failed ジョブの確認、失敗ジョブのリトライが可能です。BULL_AUTH_KEYapi サービスの env タブから確認できます。

バージョン情報

Firecrawl upstream は semver タグを公開していません — :latest のみで、main ブランチが進むたびに再ビルドされます。再現性のあるデプロイのために、このテンプレートでは各 image を digest(@sha256:...)で固定しており、現在は 2026-05-04 のビルドに対応します。アップデートは新しいテンプレートリビジョンとして公開されます。

参考資料