bytedance/sa2va-4b-video

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos

Популярность: 65 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownerbytedance
  • Namesa2va-4b-video
  • Visibilitypublic
  • Latest Version12093a2cbbd53848e1033678c0f9bc89ff9c0a390a2c416a885cb3715b9926bd

GitHub

License

Paper