Label Studio
オープンソースのデータラベリングツール。テキスト、画像、音声、動画、時系列に対応。高品質なトレーニングデータを必要とするMLチーム向け。
デプロイ後にできること
- アカウント作成 — 初回アクセス時にメールとパスワードで登録し、ワークスペースを設定
- ラベリングプロジェクトを開始 — プロジェクトを作成、データをインポートし、50以上のテンプレートから選択
- ラベリングUIをカスタマイズ — 柔軟なXML設定でアノテーションインターフェースを設計
- チームメンバーを招待 — アノテーターやレビュアーを追加して共同作業
- アノテーションをエクスポート — JSON、CSV、COCO、VOCなどのML対応形式でダウンロード
主な機能
- マルチタイプ対応:テキスト、画像、音声、動画、HTML、時系列
- NER、分類、物体検出など50以上のテンプレート
- XMLベースのカスタマイズ可能なアノテーションUI
- ロールベースのアクセス制御によるチーム協力
- 事前ラベリングと能動学習のためのMLバックエンド連携
- クラウドストレージからのデータインポート(S3、GCS、Azure Blob)
- 主要MLフレームワーク互換のエクスポート形式
- プログラムによるアクセスと自動化のためのREST API
ライセンス
Apache-2.0 — GitHub