nateraw/llama-2-70b-chat-awq

llama-2-70b-chat quantized with AWQ and served with vLLM

Популярность: 87 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownernateraw
  • Namellama-2-70b-chat-awq
  • Visibilitypublic
  • Latest Version9bf9d123b18f1b38cb753ec53a1a4d7158df85cf9de8bf0860f001f7d43d590d

GitHub

License

Paper