Model requirements
Pick a model page to see estimated VRAM needs, Q4 fit across common GPUs, Ollama command, and calculator links.
8B · Q4 about 6.00 GB · llama3.1:8b
70B · Q4 about 44 GB · llama3.1:70b
7B · Q4 about 5.50 GB · qwen2.5-coder:7b
14B · Q4 about 10.5 GB · qwen2.5-coder:14b
32B · Q4 about 21 GB · qwen2.5-coder:32b
8B · Q4 about 6.00 GB · qwen3:8b
8B · Q4 about 6.00 GB · deepseek-r1:8b
14B · Q4 about 10.5 GB · deepseek-r1:14b
32B · Q4 about 21 GB · deepseek-r1:32b
4B · Q4 about 3.50 GB · gemma3:4b
12B · Q4 about 9.00 GB · gemma3:12b
27B · Q4 about 18 GB · gemma3:27b
7B · Q4 about 5.50 GB · mistral:7b
46.7B · Q4 about 28 GB · mixtral:8x7b
14B · Q4 about 10.5 GB · phi4:14b