Все модели

End-to-end AI speech model designed for natural-sounding conversational speech synthesis, with support for context-aware prosody, intonation, and emotional expression.

26 967 запусков

mcai/babes-v2.0

Generate a new image given any input text with Babes 2.0

26 883 запусков

stackadoc/stable-audio-open-1.0

Stable Audio Open is an open-source model optimized for generating short audio samples, sound effects, and production elements using text prompts.

26 778 запусков

meta/ic_gan

Instance-Conditioned GAN

26 714 запусков

adirik/realvisxl-v4.0-lightning

Photorealism with RealVisXL V4.0 Lightning

26 593 запусков

ultralytics/yolo11n

Ultralytics YOLO11n object detection model with 2.6M parameters. Achieves 39.5 mAP50-95 on COCO dataset. Optimized for real-time inference with 1.55 ms speed on T4 GPU..

26 580 запусков

asiryan/anima-pencil-xl-v5

Anima Pencil XL v5 Model (Text2Img, Img2Img and Inpainting)

26 510 запусков

01-ai/yi-6b-chat

The Yi series models are large language models trained from scratch by developers at 01.AI.

26 493 запусков

fofr/video-to-frames

Split a video into frames

26 473 запусков

reve/edit-fast

Reve's fast image edit model at only $0.01 per edit

26 400 запусков

kcaverly/openchat-3.5-1210-gguf

The "Overall Best Performing Open Source 7B Model" for Coding + Generalization or Mathematical Reasoning

26 303 запусков

wan-video/wan-2.2-animate-replace

Use Wan 2.2 Animate to replace a character in a video scene

26 056 запусков

paper11667/clipstyler

Image Style Transfer with Text Condition

25 971 запусков

sabuhigr/sabuhi-model

Whisper AI with channel separation and speaker diarization

25 521 запусков

fofr/toolkit

Video toolkit – convert, make GIFs, extract audio

25 385 запусков

levelsio/disposable-camera

Take photos with a disposable camera. Like this? Use this with yourself in it on my app PhotoAI.com

25 339 запусков

camenduru/tripo-sr

TripoSR: Fast 3D Object Reconstruction from a Single Image

25 317 запусков

awerks/whisperx

Fast automatic speech recognition (70x realtime with large-v2) with word-level timestamps and speaker diarization.

25 284 запусков

xpixelgroup/hat

Activating More Pixels in Image Super-Resolution Transformer

25 270 запусков

jschoormans/rvision-inp-slow

Realistic vision + inpainting + controlnet pose

24 995 запусков

adirik/owlvit-base-patch32

Zero-shot / open vocabulary object detection

24 965 запусков

pixray/text2image-future

pixray text2image (future branch)

24 963 запусков

philz1337x/multidiffusion-upscaler

High resolution image Upscaler and Enhancer. Twitter/X: @philz1337x

24 944 запусков

nvidia/parakeet-rnnt-1.1b

🗣️ Nvidia + Suno.ai's speech-to-text conversion with high accuracy and efficiency 📝

24 453 запусков

viktorfa/oot_diffusion

Virtual dressing room

24 415 запусков

asiryan/kolors

Kolors Model (Text2Img and Img2Img)

24 266 запусков

cjwbw/portraitplus

Portraits with stable-diffusion

24 266 запусков

nyxynyx/f5-tts

F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching. Voice cloning

24 205 запусков

oranzino/abyss_orange_mix2

24 135 запусков

usamaehsan/controlnet-x-majic-mix-realistic-x-ip-adapter

works with inpainting and multi-controlnet + single-controlnet || ip-adapter + without ip adapter

23 976 запусков

zylim0702/sdxl-lora-customize-training

Introducing a Lora Instant Training model for crafting stunning 1024x1024 visuals. Train your own Lora Model via zip photos for instant outputs. Try Lora Model using this link: https://replicate.com/zylim0702/sdxl-lora-customize-model.

23 797 запусков

jschoormans/unstaging

Removes furniture

23 453 запусков

pollinations/amt

Video Smoother: AMT All-Pairs Multi-Field Transforms for Efficient Frame Interpolation

23 398 запусков

lucataco/mvsep-mdx23-music-separation

Model for Sound demixing challenge 2023: Music Demixing Track - MDX'23

23 314 запусков

Назад Страница 19 из 115 Вперед