Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

50

Full-text search

Active filters: ModelOpt

NVFP4/Qwen3-0.6B-FP4

Text Generation • 0.4B • Updated Aug 10, 2025 • 169

nvidia/gpt-oss-120b-Eagle3-long-context

Text Generation • 0.2B • Updated 14 days ago • 4.2k • 57

jonlizardo/affine-gpt-oss-120b-light

Text Generation • 0.2B • Updated Aug 27, 2025 • 1

nvidia/Phi-4-multimodal-instruct-FP8

6B • Updated Sep 5, 2025 • 30.6k • 4

nvidia/Phi-4-reasoning-plus-FP8

15B • Updated Sep 15, 2025 • 527 • 3

nvidia/Phi-4-reasoning-plus-NVFP4

8B • Updated Sep 5, 2025 • 6.96k • 6

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 95.2k • 6

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 9.31k • 13

nvidia/Qwen3-8B-FP8

Text Generation • 8B • Updated Sep 9, 2025 • 5.01k • 3

nvidia/Qwen3-14B-NVFP4

Text Generation • 8B • Updated Sep 9, 2025 • 17.6k • 5

nvidia/Qwen3-14B-FP8

Text Generation • 15B • Updated Sep 9, 2025 • 3.07k • 2

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 13.2k • 5

nvidia/Qwen2.5-VL-7B-Instruct-FP8

Text Generation • 8B • Updated Dec 12, 2025 • 669 • 7

nvidia/gpt-oss-120b-Eagle3-short-context

Text Generation • Updated 14 days ago • 5.84k • 14

nvidia/DeepSeek-V3.1-NVFP4

Text Generation • 394B • Updated 28 days ago • 61.7k • 12

nvidia/gpt-oss-120b-Eagle3-throughput

Text Generation • Updated 14 days ago • 795 • 33

Daemontatox/Qwen3-L-NVFP4

Text Generation • 133B • Updated Dec 10, 2025 • 1

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated 10 days ago • 671 • 1

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated 5 days ago • 67

eugene141759/affine-best-5FsZP1ipNDE6Esg9rf8AnepyXQFC8xRKQFWPRRFr15p9covj

Text Generation • 394B • Updated 12 days ago • 44