microsoft/phi-4-multimodal-instruct

Phi-4-multimodal-instruct is a lightweight open multimodal foundation model that leverages the language, vision, and speech research and datasets used for Phi-3.5 and 4.0 models.

Популярность: 17 392 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownermicrosoft
  • Namephi-4-multimodal-instruct
  • Visibilitypublic
  • Latest Version40c8f5c03ce250441855e776528bafd11cdb302c6677613acc0942c58dbd0afa

GitHub

License

Paper