Humanity&#39;s Last Exam Leaderboard

Gemini 3.1 Pro Preview

$2.000

$12.000

44.7

GPT-5.4

$2.500

$15.000

41.6

Gemini 3.5 Flash

$1.500

$9.000

41.0

GPT-5.3 Codex

$1.750

$14.000

39.9

Gemini 3.5 Flash

$1.500

$9.000

39.9

Claude Opus 4.7

$5.000

$25.000

39.6

Qwen3.7 Max

$1.250

$3.750

38.1

Gemini 3 Pro Preview

$2.000

$12.000

37.2

Claude Opus 4.6 Thinking

$5.000

$25.000

36.7

Kimi K2.6

$0.684

$3.400

35.9

DeepSeek V4 Pro

$0.435

$0.870

35.9

GPT-5.2 Pro

$10.500

$84.000

35.4

Gemini 3 Flash Preview Thinking

$0.500

$3.000

34.7

MiMo v2.5 Pro

$0.435

$0.870

33.8

GPT-5.2-Codex

$1.750

$14.000

33.5

KwaiKAT

KAT-Coder-Pro V1

$0.207

$0.828

33.4

DeepSeek V4 Flash (Non-Reasoning)

$0.098

$0.197

32.1

Claude Opus 4.7

$5.000

$25.000

31.2

Claude Sonnet 4.6

$3.000

$15.000

30.0

Kimi K2.5 Thinking

$0.400

$1.900

29.4

GPT-5.4

$2.500

$15.000

28.9

Claude Opus 4.5 Thinking

$5.000

$25.000

28.4

MiniMax M2.7

$0.279

$1.200

28.1

GLM 5.1

$0.980

$3.080

28.0

Gemini 3 Pro Preview

$2.000

$12.000

27.6

Qwen3.5 397B A17B

$0.390

$0.900

27.3

GLM 5 Thinking

$0.600

$2.080

27.2

$1.250

$10.000

26.5

GPT-5.1

$1.250

$10.000

26.5

Qwen3 Max Thinking Thinking

$0.780

$3.900

26.2

DeepSeek V3.2 Speciale

$0.270

$0.400

26.1

GPT-5 Codex

$1.250

$10.000

25.6

GLM 5.1

$0.980

$3.080

25.6

GLM-5 Turbo

$1.200

$4.000

25.4

GLM 4.7 Thinking

$0.400

$1.540

25.1

GPT-5.2

$1.750

$14.000

24.9

Grok 4

$3.000

$15.000

23.9

$1.250

$10.000

23.5

GPT-5.1-Codex

$1.250

$10.000

23.4

Qwen3.5-122B-A10B

$0.260

$0.900

23.4

Gemini 3.5 Flash

$1.500

$9.000

23.1

Gemma 4 31B Instruct

$0.120

$0.370

22.7

StepFun

Step 3.5 Flash

$0.090

$0.300

22.6

Kimi K2 0711

$0.550

$2.200

22.3

DeepSeek V3.2 Thinking

$0.229

$0.343

22.2

MiniMax M2.1

$0.290

$0.950

22.2

Qwen3.5-27B

$0.195

$0.900

22.2

Gemini 2.5 Pro

$1.000

$10.000

21.1

MiMo-V2-Flash Thinking

$0.100

$0.300

21.1

Qwen3.6 35B A3B

$0.140

$0.900

20.2

$2.000

$8.000

20.0

MiMo-V2-Flash

$0.100

$0.300

20.0

MiMo v2 Omni

$0.400

$2.000

19.9

GPT-5 Mini

$0.250

$2.000

19.7

Qwen3.5-35B-A3B

$0.140

$0.900

19.7

StepFun

Step 3.5 Flash

$0.090

$0.300

19.1

MiniMax M2.5

$0.150

$1.150

19.1

Qwen3.5 397B A17B

$0.390

$0.900

18.8

Claude Opus 4.6

$5.000

$25.000

18.6

GPT-OSS-120b

$0.039

$0.100

18.5

$1.250

$10.000

18.4

Gemma 4 26B A4B Instruct

$0.060

$0.300

18.3

Kimi K2.6

$0.684

$3.400

18.2

Grok 4.1 Fast Thinking

$0.000

17.6

o4 Mini

$0.550

$2.200

17.5

Claude Sonnet 4.5 Thinking

$3.000

$15.000

17.3

Gemini 2.5 Pro Preview 06-05

$1.250

$10.000

17.1

Grok 4 Fast Thinking

$0.200

$0.500

17.0

GPT-5.1-Codex-Mini

$0.250

$2.000

16.9

Gemini 3.1 Flash Lite Preview

$0.250

$1.500

16.2

GLM-5V Turbo

$1.200

$4.000

15.8

Inception

Mercury 2

$0.250

$0.750

15.5

Gemini 2.5 Pro Preview 05-06

$1.250

$10.000

15.4

DeepSeek V3.1 Terminus Thinking

$0.270

$0.950

15.2

Qwen3 235B A22B Thinking 2507 Thinking

$0.100

15.0

R1 0528

$0.500

$2.150

14.9

Qwen3.5-122B-A10B

$0.260

$0.900

14.8

GPT-5 Mini

$0.250

$2.000

14.6

Gemini 3 Flash Preview

$0.500

$3.000

14.1

DeepSeek V3.2 Exp Thinking

$0.270

$0.410

13.8

GLM 4.6 Thinking

$0.430

$1.740

13.3

Qwen3.5 9B

$0.040

$0.150

13.3

MiMo v2.5 Pro

$0.435

$0.870

13.3

Claude Sonnet 4.6

$3.000

$15.000

13.2

Qwen3.5-27B

$0.195

$0.900

13.2

DeepSeek V3.1 Thinking

$0.210

$0.790

13.0

Claude Opus 4.5

$5.000

$25.000

12.9

Qwen3.5-35B-A3B

$0.140

$0.900

12.8

MiniMax M2

$0.255

$1.000

12.5

Qwen3.6 35B A3B

$0.140

$0.900

12.5

o3 Mini High

$1.100

$4.400

12.3

Kimi K2.5

$0.400

$1.900

12.3

GLM 4.5 Thinking

$0.600

$2.200

12.2

Prime Intellect

INTELLECT-3

$0.200

$1.100

12.1

Qwen3 Max Thinking

$0.780

$3.900

12.0

Claude Opus 4.1 Thinking

$15.000

$75.000

11.9

Qwen3 235B A22B Thinking

$0.455

$0.900

11.7

Claude Opus 4 Thinking

$15.000

$75.000

11.7

Qwen3 Next 80B A3B Thinking Thinking

$0.098

$0.300

11.7

Gemini 2.5 Flash Thinking

$0.300

$2.500

11.6

Grok 3 Mini

$0.250

$0.500

11.1

Gemini 2.5 Flash Thinking

$0.300

$2.500

11.1

Qwen3 Max

$0.780

$3.900

11.1

Cogito v2.1 671B Thinking

Deep Cogito

$0.900

11.0

Claude Sonnet 4.6

$3.000

$15.000

10.8

Gemma 4 26B A4B Instruct

$0.060

$0.300

10.7

Qwen3 235B A22B Instruct 2507

$0.071

$0.100

10.6

GPT-5.4

$2.500

$15.000

10.6

DeepSeek V3.2

$0.229

$0.343

10.5

Claude 3.7 Sonnet Thinking

$3.000

$15.000

10.3

Hermes 4 405B Thinking

$1.000

$3.000

10.3

Nemotron 3 Nano 30B A3B Thinking

$0.050

$0.200

10.2

Qwen3 VL 235B A22B Thinking Thinking

$0.260

$0.900

10.1

GPT-OSS-20b

$0.029

$0.140

9.8

Qwen3 30B A3B Thinking 2507 Thinking

$0.080

$0.400

9.8

Claude Haiku 4.5 Thinking

$1.000

$5.000

9.7

Claude Sonnet 4 Thinking

$3.000

$15.000

9.6

Qwen3 VL 32B Instruct Thinking

$0.104

$0.416

9.6

$0.550

$2.000

9.3

Qwen3 Max

$0.780

$3.900

9.3

Qwen3 Coder Next

$0.110

$0.800

9.3

GLM 4.6V Thinking

$0.300

$0.900

8.9

o3 Mini

$0.550

$2.200

8.7

Qwen3 VL 30B A3B Thinking Thinking

$0.130

$0.900

8.7

DeepSeek V3.2 Exp

$0.270

$0.410

8.6

Qwen3.5 9B

$0.040

$0.150

8.6

DeepSeek V3.1 Terminus

$0.270

$0.950

8.4

Qwen3 32B Thinking

$0.080

$0.280

8.3

QwQ 32B

$0.900

8.2

MiniMax M1

$0.400

$2.200

8.2

GPT-5 Nano

$0.050

$0.400

8.2

MiMo-V2-Flash

$0.100

$0.300

8.0

Perplexity

Sonar Pro

$3.000

$15.000

7.9

Hermes 4 70B Thinking

$0.130

$0.400

7.9

$15.000

$60.000

7.7

DeepSeek V4 Pro

$0.435

$0.870

7.7

GPT-5 Nano

$0.050

$0.400

7.6

MiniMax M1

$0.400

$2.200

7.5

Grok Code Fast 1

$0.200

$1.500

7.5

Perplexity

Sonar

$1.000

7.3

Qwen3 Next 80B A3B Instruct

$0.090

$0.780

7.3

GPT-5.2

$1.750

$14.000

7.3

GLM 5

$0.600

$2.080

7.2

Claude Sonnet 4.5

$3.000

$15.000

7.1

GLM-4.7-Flash Thinking

$0.060

$0.400

7.1

Kimi K2 0711

$0.550

$2.200

7.0

DeepSeek V4 Flash (Non-Reasoning)

$0.098

$0.197

7.0

GLM 4.5 Air

$0.125

$0.850

6.8

Qwen3 30B A3B Instruct 2507

$0.043

$0.172

6.8

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

6.8

Qwen3 30B A3B Thinking

$0.080

$0.280

6.6

Gemini 2.5 Flash Lite Preview 09-2025 Thinking

$0.100

$0.400

6.6

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

6.5

Gemini 2.5 Flash Lite Thinking

$0.100

$0.400

6.4

Qwen3 VL 30B A3B Instruct

$0.130

$0.520

6.4

DeepSeek V3.1

$0.210

$0.790

6.3

Kimi K2 0905 (exacto)

$0.600

$2.500

6.3

Qwen3 VL 235B A22B Instruct

$0.200

$0.880

6.3

Qwen3 VL 32B Instruct

$0.104

$0.416

6.3

InclusionAI

Ling 2.6 Flash

$0.010

$0.030

6.2

R1 Distill Llama 70B

$0.700

$0.800

6.1

GLM 4.7

$0.400

$1.540

6.1

Olmo 3.1 32B Think

$0.150

$0.500

6.0

Qwen3 4B Thinking

$0.200

5.9

Claude Opus 4

$15.000

$75.000

5.9

GLM 4.5V Thinking

$0.600

$1.800

5.9

Olmo 3 32B Think

$0.150

$0.500

5.9

GPT-5 Chat

$1.250

$10.000

5.8

Olmo 3 7B Instruct

$0.100

$0.200

5.8

Olmo 3 7B Think

$0.120

$0.200

5.7

R1 Distill Qwen 32B

$0.290

5.5

$1.250

$10.000

5.4

Llama 3.2 1B Instruct

$0.020

5.3

Gemini 2.0 Flash

$0.100

$0.400

5.3

Nemotron Nano 12B 2 VL Thinking

$0.200

5.3

Llama 3.2 3B Instruct

$0.030

$0.050

5.2

Llama 3.2 11B Vision Instruct

$0.060

5.2

Gemma 3 4B

$0.040

$0.080

5.2

DeepSeek V3 0324

$0.200

$0.770

5.2

GPT-OSS-120b

$0.039

$0.100

5.2

GLM 4.6

$0.430

$1.740

5.2

GPT-5.1

$1.250

$10.000

5.2

Llama 3 8B Instruct

$0.040

5.1

Llama 3.1 8B Instruct

$0.020

$0.050

5.1

Qwen3 4B Thinking

$0.200

5.1

Grok 3

$3.000

$15.000

5.1

Gemini 2.5 Flash

$0.300

$2.500

5.1

GPT-OSS-20b

$0.029

$0.140

5.1

Gemini 2.5 Flash

$0.300

$2.500

5.0

Grok 4 Fast

$0.200

$0.500

5.0

Grok 4.1 Fast

$0.000

5.0

Liquid AI

LiquidAI/LFM2-8B-A1B

$0.010

$0.020

4.9

Olmo 3.1 32B Instruct

$0.200

$0.600

4.9

GLM-4.7-Flash

$0.060

$0.400

4.9

Claude 3.7 Sonnet

$3.000

$15.000

4.8

QwQ 32B

$0.900

4.8

Gemma 3 12B

$0.040

$0.130

4.8

Mistral Small 3.1 24B

$0.100

$0.300

4.8

Llama 4 Maverick

$0.150

$0.600

4.8

Qwen2.5 Coder 7B Instruct

$0.200

4.8

Nova Micro 1.0

$0.035

$0.140

4.7

Gemma 3 27B

$0.080

$0.160

4.7

Qwen3 235B A22B

$0.455

$0.900

4.7

Qwen3 4B

$0.200

4.7

Nova Premier 1.0

$2.500

$12.500

4.7

Llama 3.1 70B Instruct

$0.340

$0.390

4.6

Llama 3.1 Nemotron 70B Instruct

$0.900

4.6

Nova Lite 1.0

$0.060

$0.240

4.6

Cohere

Command A

$2.500

$10.000

4.6

GPT-4.1 Mini

$0.400

$1.600

4.6

GPT-4.1

$2.000

$8.000

4.6

Qwen3 30B A3B

$0.080

$0.280

4.6

Nemotron Nano 9B V2 Thinking

$0.040

$0.160

4.6

Gemini 2.5 Flash Lite Preview 09-2025

$0.100

$0.400

4.6

Ministral 3 14B 2512

$0.200

4.6

Nemotron 3 Nano 30B A3B

$0.050

$0.200

4.6

Mixtral 8x7B Instruct

$0.140

$0.420

4.5

Qwen-Max

$1.040

$4.160

4.5

Nemotron Nano 12B 2 VL

$0.200

4.5

Llama 3 70B Instruct

$0.510

$0.740

4.4

Gemini 2.0 Flash Lite

$0.075

$0.300

4.4

Gemma 3n 4B

$0.060

$0.120

4.4

Qwen3 Coder 480B A35B (exacto)

$0.220

$0.900

4.4

Mistral Medium 3.1

$0.400

$2.000

4.4

Molmo 2 8B

$0.200

4.4

Llama 4 Scout

$0.080

$0.300

4.3

Qwen3 32B

$0.080

$0.280

4.3

Qwen3 14B Thinking

$0.080

$0.200

4.3

Mistral Medium 3

$0.400

$2.000

4.3

Mistral Small 3.2 24B

$0.075

$0.200

4.3

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

4.3

Claude Haiku 4.5

$1.000

$5.000

4.3

Ministral 3 8B 2512

$0.150

4.3

Llama 3.1 405B Instruct

$0.900

4.2

Qwen2.5 72B Instruct

$0.360

$0.400

4.2

Qwen-Turbo

$0.033

$0.130

4.2

Qwen3 14B

$0.080

$0.200

4.2

Qwen3 8B Thinking

$0.050

$0.200

4.2

Hermes 4 405B

$1.000

$3.000

4.2

Mixtral 8x22B Instruct

$1.200

4.1

Hermes 3 70B Instruct

$0.300

4.1

Microsoft

Phi 4

$0.065

$0.140

4.1

Mistral Small 24B Instruct 2501

$0.050

$0.080

4.1

Saba

$0.200

$0.600

4.1

GPT-5 Nano

$0.050

$0.400

4.1

GPT-4o-mini

$0.150

$0.600

4.0

Mistral Large 2411

$2.000

$6.000

4.0

Llama 3.3 70B Instruct

$0.100

$0.320

4.0

Claude Sonnet 4

$3.000

$15.000

4.0

Qwen3 Coder 30B A3B Instruct

$0.070

$0.270

4.0

Nemotron Nano 9B V2

$0.040

$0.160

4.0

Claude 3 Haiku

$0.250

$1.250

3.9

Claude 3.5 Sonnet

$3.000

$15.000

3.9

GPT-4.1 Nano

$0.100

$0.400

3.9

Qwen2.5 Coder 32B Instruct

$0.660

$0.800

3.8

Qwen2.5 VL 32B Instruct

$0.900

3.8

Devstral Medium

$0.400

$2.000

3.8

AI21 Labs

Jamba Large 1.7

$2.000

$8.000

3.8

Olmo 2 32B Instruct

$0.050

$0.200

3.7

Qwen3 4B

$0.200

3.7

Devstral Small 1.1

$0.070

$0.280

3.7

Gemini 2.5 Flash Lite

$0.100

$0.400

3.7

GLM 4.6V

$0.300

$0.900

3.7

Pixtral Large 2411

$2.000

$6.000

3.6

Gemini 2.0 Flash Lite

$0.075

$0.300

3.6

DeepSeek V3 0324

$0.200

$0.770

3.6

GLM 4.5V

$0.600

$1.800

3.6

Hermes 4 70B

$0.130

$0.400

3.6

Devstral 2 2512

$0.400

$0.900

3.6

Claude 3.5 Haiku

$0.800

$4.000

3.5

Baidu

ERNIE 4.5 300B A47B

$0.900

3.5

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

3.5

Mistral Large

$0.500

$1.500

3.4

Nova Pro 1.0

$0.800

$3.200

3.4

GPT-4 Turbo

$10.000

$30.000

3.3

Qwen3 VL 8B Thinking Thinking

$0.117

$1.365

3.3

Mistral Large 2407

$2.000

$6.000

3.2

Nova 2 Lite

$0.300

$2.500

3.0

Qwen3 VL 8B Instruct

$0.080

$0.200

2.9

Qwen3 8B

$0.050

$0.200

2.8