bytedance/sa2va-26b-video

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos

Популярность: 614 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownerbytedance
  • Namesa2va-26b-video
  • Visibilitypublic
  • Latest Versionb5f31abc431a2348551fb0f60845572ea61ff3d1d4d55cf2bd59209290680681

GitHub

License

Paper