Spanvero How it works Find a model Compare models Pricing

The best open LLMs you can actually run on a laptop

Open LLMs light enough for a real laptop — fitting in about 6 GB at their default quant, so they leave headroom for the OS on an entry laptop GPU or a 16 GB Mac's shared memory. This is a deliberately tighter budget than a desktop's full 8 GB card, ranked by popularity/recognition among the models that fit portable hardware, with the honest $0 offline cost.

How this is ranked: Objective fit filter at a laptop-conservative 6 GB (tighter than the 8 GB desktop page, since a laptop shares memory with the OS). 'Best for a laptop' = 'comfortably runs on portable hardware,' computed by the engine — not a quality ranking. Exact fit depends on the user's RAM/VRAM; the advisor checks their machine.

1. Qwen3 0.6B — Qwen, 800M · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
2. Qwen3 4B — Qwen, 4B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
3. Qwen2.5 3B Instruct — Qwen, 3.1B · ~4.0 GB VRAM · $0.12/1M API est. · non-commercial
4. Llama 3.2 3B Instruct — Meta, 3B · ~5.0 GB VRAM · $0.19/1M API · commercial OK
5. Qwen2.5 1.5B Instruct — Qwen, 1.5B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
6. gemma 3 270m — google, 300M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
7. Qwen3 1.7B — Qwen, 2B · ~5.0 GB VRAM · $0.12/1M API est. · commercial OK
8. BGE-M3 — BAAI, 567M · ~3.0 GB VRAM · $0.10/1M API est. · commercial OK
9. Qwen3 4B Instruct 2507 — Qwen, 4B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
10. Qwen2.5 0.5B Instruct — Qwen, 500M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
11. Qwen2 1.5B Instruct — Qwen, 1.5B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
12. Llama 3.2 1B Instruct — Meta, 1.2B · ~3.0 GB VRAM · $0.11/1M API · commercial OK
13. Llama 3.2 1B — meta-llama, 1.2B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
14. Qwen2.5 0.5B — Qwen, 500M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
15. Phi-3.5-mini Instruct — Microsoft, 3.8B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
16. gemma 3 1b it — google, 1B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
17. TinyLlama 1.1B Chat v1.0 — TinyLlama, 1.1B · ~2.0 GB VRAM · $0.11/1M API est. · commercial OK
18. Rio 3.0 Open Mini — prefeitura-rio, 4B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
19. gpt2 large — openai-community, 800M · ~2.0 GB VRAM · $0.11/1M API est. · commercial OK
20. OpenELM 1 1B Instruct — apple, 1.1B · ~3.0 GB VRAM · $0.11/1M API est. · non-commercial
21. PowerMoE 3b — ibm-research, 3.4B · ~4.0 GB VRAM · $0.13/1M API est. · commercial OK
22. Phi 4 mini instruct — microsoft, 3.8B · ~6.0 GB VRAM · $0.22/1M API · commercial OK
23. Qwen2.5 1.5B — Qwen, 1.5B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
24. NVIDIA Nemotron 3 Nano 4B BF16 — nvidia, 4B · ~6.0 GB VRAM · $0.13/1M API est. · non-commercial
25. h2ovl mississippi 800m — h2oai, 800M · ~2.0 GB VRAM · $0.11/1M API est. · commercial OK
26. h2ovl mississippi 2b — h2oai, 2.2B · ~4.0 GB VRAM · $0.12/1M API est. · commercial OK
27. Nomic Embed Text v1.5 — Nomic AI, 137M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
28. Qwen2 0.5B — Qwen, 500M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
29. SmolLM 1.7B Instruct quantized.w4a16 — nm-testing, 1.8B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
30. Qwen2.5 1.5B quantized.w8a8 — RedHatAI, 1.8B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
31. Qwen2.5 Math 1.5B — Qwen, 1.5B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
32. gpt neo 2.7B — EleutherAI, 2.7B · ~4.0 GB VRAM · $0.12/1M API est. · commercial OK
33. Llama 3.2 3B — meta-llama, 3.2B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
34. Qwen2 0.5B Instruct — Qwen, 500M · ~2.0 GB VRAM · $0.10/1M API est. · commercial OK
35. Phi tiny MoE instruct — microsoft, 3.8B · ~4.0 GB VRAM · $0.13/1M API est. · commercial OK
36. Qwen2.5 Coder 1.5B Instruct — Qwen, 1.5B · ~3.0 GB VRAM · $0.11/1M API est. · commercial OK
37. Qwen2.5 Coder 3B — Qwen, 3.1B · ~4.0 GB VRAM · $0.12/1M API est. · non-commercial
38. Qwen3 4B Base — Qwen, 4B · ~5.0 GB VRAM · $0.13/1M API est. · commercial OK
39. Kimi K3 DSpark — RadixArk, 2.2B · ~3.0 GB VRAM · $0.12/1M API est. · non-commercial
40. Qwen3 1.7B Base — Qwen, 1.7B · ~4.0 GB VRAM · $0.11/1M API est. · commercial OK

Showing the top 40 of 159. See all →

More: all "best" lists · Outcome Lab · all models

The weekly price index

A short email of real AI price moves, straight from the daily log — no hype. We're collecting the list now; the first issue goes out when it opens. Unsubscribe with one click.

Joining the list needs JavaScript — or just email support@spanvero.com and we'll add you.