nateraw/llama-2-70b-chat-awq
llama-2-70b-chat quantized with AWQ and served with vLLM
Популярность: 87 запусков
Запуск модели
Для MVP ввод передается raw JSON в поле `input` Replicate.
Чтобы запускать модели, войдите в аккаунт.
llama-2-70b-chat quantized with AWQ and served with vLLM
Популярность: 87 запусков
Для MVP ввод передается raw JSON в поле `input` Replicate.
Чтобы запускать модели, войдите в аккаунт.