cjwbw/pix2struct

Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding

Популярность: 6 073 запусков

Запуск модели

Для MVP ввод передается raw JSON в поле `input` Replicate.

Чтобы запускать модели, войдите в аккаунт.

Метаданные

  • Ownercjwbw
  • Namepix2struct
  • Visibilitypublic
  • Latest Versione32d77481424b47e7959836638b62082d8528b0c66a3a30eedca3970aaf786e7

GitHub

Paper