Spanvero How it works Find a model Compare models Pricing

The cheapest open LLMs to run via your own API key

Open LLMs ranked by their real, dated $/1M-token price (blended input+output) on your own API key — cheapest first, $0 markup. This list only includes models we have an actual, verified price for; we never pad it with size-based guesses. The $0-on-your-own-hardware and rent-a-GPU options are shown on each model's page.

How this is ranked: Built only from real, dated prices in model-prices.ts — size-estimated models are EXCLUDED from this ranking entirely (so no fabricated figure can drive the order). 'Cheapest' is a measured dollar amount, not a quality claim; open the advisor for your exact workload.

1. Ling 2.6 flash — inclusionAI, 107.5B · $0.02/1M API · ~81 GB VRAM · commercial OK
2. Gemma 2 9B Instruct — Google, 9B · $0.06/1M API · ~9.0 GB VRAM · commercial OK
3. Nex N2 mini — nex-agi, 35.1B · $0.06/1M API · ~41 GB VRAM · commercial OK
4. Llama 3.1 8B Instruct — Meta, 8B · $0.07/1M API · ~8.0 GB VRAM · commercial OK
5. Mistral Small 3 (24B, 2501) — Mistral AI, 23.6B · $0.07/1M API · ~20 GB VRAM · commercial OK
6. granite 4.1 8b — ibm-granite, 8.8B · $0.08/1M API · ~9.0 GB VRAM · commercial OK
7. gpt-oss-20b — OpenAI, 21B · $0.08/1M API · ~15 GB VRAM · commercial OK
8. Laguna XS 2.1 — poolside, 33.4B · $0.09/1M API · ~24 GB VRAM · non-commercial
9. Trinity Mini — arcee-ai, 26.1B · $0.10/1M API · ~19 GB VRAM · non-commercial
10. Gemma 3 12B — Google, 12B · $0.10/1M API · ~13 GB VRAM · commercial OK
11. gpt-oss-120b — OpenAI, 117B · $0.10/1M API · ~80 GB VRAM · commercial OK
12. Phi-4 — Microsoft, 14B · $0.11/1M API · ~13 GB VRAM · commercial OK
13. Llama 3.2 1B Instruct — Meta, 1.2B · $0.11/1M API · ~3.0 GB VRAM · commercial OK
14. Qwen3 30B A3B Instruct 2507 — Qwen, 30.5B · $0.12/1M API · ~22 GB VRAM · commercial OK
15. DeepSeek V4 Flash 0731 — deepseek-ai, 304.2B · $0.14/1M API · ~205 GB VRAM · commercial OK
16. Laguna S 2.1 — poolside, 117.6B · $0.14/1M API · ~81 GB VRAM · non-commercial
17. Hy3 preview — tencent, 298.8B · $0.14/1M API · ~204 GB VRAM · non-commercial
18. Qwen2.5 7B Instruct — Alibaba, 7B · $0.15/1M API · ~7.0 GB VRAM · commercial OK
19. Laguna XS.2 — poolside, 33.4B · $0.15/1M API · ~24 GB VRAM · commercial OK
20. Qwen3 Coder 30B A3B Instruct — Qwen, 30.5B · $0.18/1M API · ~22 GB VRAM · commercial OK
21. Qwen3-32B — Alibaba, 32.8B · $0.18/1M API · ~25 GB VRAM · commercial OK
22. gpt oss safeguard 20b — openai, 21.5B · $0.19/1M API · ~16 GB VRAM · commercial OK
23. Llama 3.2 3B Instruct — Meta, 3B · $0.19/1M API · ~5.0 GB VRAM · commercial OK
24. Mistral 7B Instruct v0.3 — Mistral AI, 7.2B · $0.20/1M API · ~8.0 GB VRAM · commercial OK
25. Llama 4 Scout (17B-16E) — Meta, 109B · $0.20/1M API · ~77 GB VRAM · commercial OK
26. DeepSeek V4 Flash — deepseek-ai, 158.1B · $0.21/1M API · ~107 GB VRAM · commercial OK
27. Phi 4 mini instruct — microsoft, 3.8B · $0.22/1M API · ~6.0 GB VRAM · commercial OK
28. GLM 4.7 Flash — zai-org, 31.2B · $0.23/1M API · ~28 GB VRAM · commercial OK
29. Mixtral 8x7B Instruct — Mistral AI, 46.7B · $0.24/1M API · ~34 GB VRAM · commercial OK
30. Llama 3.3 70B Instruct — Meta, 70B · $0.27/1M API · ~53 GB VRAM · commercial OK
31. Gemma 3 27B — Google, 27B · $0.27/1M API · ~30 GB VRAM · commercial OK
32. Qwen3-8B — Alibaba, 8.2B · $0.29/1M API · ~9.0 GB VRAM · commercial OK
33. Qwen3 30B A3B — Qwen, 30.5B · $0.31/1M API · ~22 GB VRAM · commercial OK
34. Hy3 — tencent, 298.8B · $0.33/1M API · ~204 GB VRAM · commercial OK
35. DeepSeek V3.2 — deepseek-ai, 685.4B · $0.33/1M API · ~490 GB VRAM · commercial OK
36. DeepSeek V3.2 Exp — deepseek-ai, 685.4B · $0.34/1M API · ~490 GB VRAM · commercial OK
37. Llama 4 Maverick (17B-128E) — Meta, 402B · $0.38/1M API · ~274 GB VRAM · commercial OK
38. Llama 3.1 70B Instruct — Meta, 70B · $0.40/1M API · ~53 GB VRAM · commercial OK
39. Qwen3 Coder Next — Qwen, 79.7B · $0.46/1M API · ~55 GB VRAM · commercial OK
40. GLM 4.5 Air — zai-org, 110.5B · $0.49/1M API · ~76 GB VRAM · commercial OK

Showing the top 40 of 67. See all →

More: all "best" lists · Outcome Lab · all models

The weekly price index

A short email of real AI price moves, straight from the daily log — no hype. We're collecting the list now; the first issue goes out when it opens. Unsubscribe with one click.

Joining the list needs JavaScript — or just email support@spanvero.com and we'll add you.