Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

4

Full-text search

Active filters: llama_bidirec

nvidia/llama-embed-nemotron-8b

Feature Extraction • 8B • Updated 23 days ago • 211k • 133

nvidia/llama-nemotron-rerank-1b-v2

Text Ranking • 1B • Updated Nov 25, 2025 • 26.9k • 29

nvidia/llama-nemotron-embed-1b-v2

Feature Extraction • 1B • Updated 23 minutes ago • 24.9k • 33

noooop9527/llama-nemotron-rerank-1b-v2-STv6

Text Ranking • 1B • Updated 19 days ago • 151