nvidia/canary-qwen-2.5b

🎤The best open-source speech-to-text model as of Jul 2025, transcribing audio with record 5.63% WER and enabling AI tasks like summarization directly from speech✨

Популярность: 15 535 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownernvidia
  • Namecanary-qwen-2.5b
  • Visibilitypublic
  • Latest Versionafba731fc7a4082730943a246233b09c7fa3dfb2c24b07fe199c1408a7c8cb2f

GitHub

License

Paper