rafaelgalle/whisper-diarization-advanced

Ultra-fast, customizable speech-to-text and speaker diarization for noisy, multi-speaker audio. Includes advanced noise reduction, stereo channel support, and flexible audio preprocessing—ideal for call centers, meetings, and podcasts.

Популярность: 377 795 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownerrafaelgalle
  • Namewhisper-diarization-advanced
  • Visibilitypublic
  • Latest Version56dcb55b658e0cb096d663aca0c44bac1466f3acf4304f8ff35af555dc43c9c9

GitHub

License

Paper