logo
icon

OpenLLM

Jalankan LLM open-source apa pun sebagai endpoint API yang kompatibel dengan OpenAI. OpenLLM mendukung berbagai model termasuk Llama, Mistral, dan Gemma, dengan chat UI bawaan dan integrasi mulus dengan LangChain, LlamaIndex, dan framework lainnya.

template cover
Dideploy0 kali
Penerbitfuturize.rush
Dibuat2026-03-30
Layanan
service icon
Tag
AILLMMachine LearningAPI

OpenLLM

Platform terbuka untuk menjalankan model bahasa besar sebagai endpoint API yang kompatibel dengan OpenAI. OpenLLM memungkinkan Anda melayani model open-source yang didukung dengan satu perintah dan menyertakan antarmuka chat bawaan untuk pengujian.

Apa yang bisa dilakukan setelah deployment

  1. Kunjungi domain Anda — Buka chat UI bawaan untuk berinteraksi dengan LLM
  2. Gunakan API kompatibel OpenAI — Hubungkan klien OpenAI SDK ke endpoint untuk akses terprogram
  3. Integrasikan dengan framework — Gunakan dengan LangChain, LlamaIndex, AutoGen, dan framework AI lainnya
  4. Uji di Playground — Eksperimen dengan prompt dan parameter berbeda di antarmuka web
  5. Pantau performa — Lihat metrik permintaan dan statistik performa model

Fitur Utama

  • API kompatibel OpenAI (endpoint chat/completions, completions)
  • Chat UI web bawaan untuk pengujian interaktif
  • Dukungan Llama, Mistral, Gemma, Phi, Qwen, dan banyak model lainnya
  • Dukungan respons streaming untuk pembuatan teks real-time
  • Unduhan dan cache model otomatis
  • Dukungan kuantisasi (GPTQ, AWQ, SqueezeLLM)
  • Inferensi multi-GPU dengan paralelisme tensor
  • Dukungan adapter untuk model fine-tuned LoRA
  • Kompatibel dengan LangChain, LlamaIndex, dan BentoML
  • API RESTful dengan dokumentasi OpenAPI otomatis

Lisensi

Apache-2.0 — GitHub