glavin001/exllama-airoboros-7b-gpt4-1.4-gptq
Test out fast inference with ExLlama and 4bit quantization!
Популярность: 1 711 запусков
Запуск модели
Для MVP ввод передается raw JSON в поле `input` Replicate.
Чтобы запускать модели, войдите в аккаунт.
Test out fast inference with ExLlama and 4bit quantization!
Популярность: 1 711 запусков
Для MVP ввод передается raw JSON в поле `input` Replicate.
Чтобы запускать модели, войдите в аккаунт.