lucataco/qwen2.5-omni-7b
Qwen2.5-Omni is an end-to-end multimodal model designed to perceive diverse modalities, including text, images, audio, and video, while simultaneously generating text and natural speech responses in a streaming manner.
Популярность: 31 610 запусков
Запуск модели
Для MVP ввод передается raw JSON в поле `input` Replicate.
Чтобы запускать модели, войдите в аккаунт.