lucataco/interactiveomni-8b

A unified omni-modal model that can simultaneously receive inputs such as images, audio, text, and video and directly generate coherent text and speech

Популярность: 78 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownerlucataco
  • Nameinteractiveomni-8b
  • Visibilitypublic
  • Latest Version6d19412f763aa2b82d67174fcbb02ca3385740dae88d9ccbded1997f59e75d2f

GitHub

License

Paper