AIME 2024 Leaderboard

$1.250

$10.000

95.7

xAI

Grok 4

$3.000

$15.000

94.3

o4 Mini

$1.100

$4.400

94.0

Qwen3 235B A22B Thinking 2507 Thinking

$0.149

$0.900

94.0

xAI

Grok 3 Mini

$0.250

$0.500

93.3

$1.250

$10.000

91.7

Qwen3 30B A3B Thinking 2507 Thinking

$0.080

$0.300

90.7

$2.000

$8.000

90.3

R1 0528

$0.500

$2.150

89.3

Gemini 2.5 Pro

$1.000

$10.000

88.7

Z AI

GLM 4.5 Thinking

$0.600

$2.200

87.3

Gemini 2.5 Pro Preview 06-05

$1.250

$10.000

87.0

o3 Mini High

$1.100

$4.400

86.0

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

86.0

MiniMax

MiniMax M1

$0.400

$2.200

84.7

Gemini 2.5 Pro Preview 05-06

$1.250

$10.000

84.3

Gemini 2.5 Flash Thinking

$0.300

$2.500

84.3

Qwen3 235B A22B Thinking

$0.455

$0.900

84.0

$1.250

$10.000

83.0

Gemini 2.5 Flash Thinking

$0.300

$2.500

82.3

MiniMax

MiniMax M1

$0.400

$2.200

81.3

Qwen3 32B Thinking

$0.080

$0.280

80.7

Perplexity

Sonar Reasoning Pro

$2.000

$8.000

79.0

QwQ 32B

$0.900

78.0

Claude Sonnet 4 Thinking

$3.000

$15.000

77.3

o3 Mini

$1.100

$4.400

77.0

Qwen3 14B Thinking

$0.060

$0.200

76.3

Claude Opus 4 Thinking

$15.000

$75.000

75.7

Qwen3 30B A3B Thinking

$0.080

$0.280

75.3

Qwen3 8B Thinking

$0.050

$0.200

74.7

Qwen3 30B A3B Instruct 2507

$0.090

$0.300

72.7

$15.000

$60.000

72.3

Qwen3 235B A22B Instruct 2507

$0.071

$0.100

71.7

Gemini 2.5 Flash Lite Thinking

$0.100

$0.400

70.3

Kimi

Kimi K2 0711

$0.550

$2.200

69.3

Kimi

Kimi K2 0711

$0.550

$2.200

69.3

R1 Distill Qwen 32B

$0.290

68.7

$0.550

$2.000

68.3

Z AI

GLM 4.5 Air

$0.130

$0.850

67.3

R1 Distill Llama 70B

$0.700

$0.800

67.0

Qwen3 4B Thinking

$0.200

65.7

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

58.3

Claude Opus 4

$15.000

$75.000

56.3

DeepSeek V3 0324

$0.200

$0.770

52.0

Gemini 2.5 Flash

$0.300

$2.500

50.0

Gemini 2.5 Flash Lite

$0.100

$0.400

50.0

Baidu

ERNIE 4.5 300B A47B

$0.280

$0.900

49.3

Perplexity

Sonar

$1.000

48.7

Claude 3.7 Sonnet Thinking

$3.000

$15.000

48.7

Qwen3 Coder 480B A35B (exacto)

$0.220

$0.900

47.7

QwQ 32B

$0.900

45.3

Mistral Medium 3

$0.400

$2.000

44.0

GPT-4.1

$2.000

$8.000

43.7

Gemini 2.5 Flash

$0.300

$2.500

43.3

GPT-4.1 Mini

$0.200

$0.800

43.0

Claude Sonnet 4

$3.000

$15.000

40.7

Llama 4 Maverick

$0.150

$0.600

39.0

$1.250

$10.000

36.7

Gemini 2.0 Flash

$0.100

$0.400

33.0

xAI

Grok 3

$3.000

$15.000

33.0

Qwen3 235B A22B

$0.455

$0.900

32.7

Mistral Small 3.2 24B

$0.075

$0.200

32.3

Gemini 2.0 Flash Lite

$0.075

$0.300

30.3

Qwen3 32B

$0.080

$0.280

30.3

Llama 3.3 70B Instruct

$0.100

$0.320

30.0

Qwen3 Coder 30B A3B Instruct

$0.070

$0.270

29.7

Perplexity

Sonar Pro

$3.000

$15.000

29.0

Llama 4 Scout

$0.080

$0.300

28.3

Qwen3 14B

$0.060

$0.200

28.0

Gemini 2.0 Flash Lite

$0.075

$0.300

27.7

Qwen3 30B A3B

$0.080

$0.280

26.0

Gemma 3 27B

$0.080

$0.160

25.3

DeepSeek V3 0324

$0.200

$0.770

25.3

Llama 3.1 Nemotron 70B Instruct

$0.900

24.7

Qwen3 8B

$0.050

$0.200

24.3

GPT-4.1 Nano

$0.050

$0.200

23.7

Qwen-Max

$1.040

$4.160

23.3

Claude 3.7 Sonnet

$3.000

$15.000

22.3

Gemma 3 12B

$0.040

$0.130

22.0

Llama 3.1 405B Instruct

$0.900

21.3

Qwen3 4B

$0.200

21.3

Qwen3 4B Thinking

$0.200

21.3

Qwen3 4B

$0.200

21.3

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

19.3

Llama 3.1 70B Instruct

$0.340

$0.390

17.3

Nova Premier 1.0

$2.500

$12.500

17.0

Qwen2.5 72B Instruct

$0.360

$0.400

16.0

Claude 3.5 Sonnet

$3.000

$15.000

15.7

GPT-4 Turbo

$5.000

$15.000

15.0

Microsoft

Phi 4

$0.065

$0.140

14.3

Gemma 3n 4B

$0.060

$0.120

13.7

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

13.7

Saba

$0.200

$0.600

13.0

Qwen2.5 Coder 32B Instruct

$0.660

$0.800

12.0

Qwen-Turbo

$0.033

$0.130

12.0

GPT-4o-mini

$0.150

$0.600

11.7

Mistral Large 2411

$2.000

$6.000

11.0

Qwen2.5 VL 32B Instruct

$0.900

11.0

Nova Pro 1.0

$0.800

$3.200

10.7

Nova Lite 1.0

$0.060

$0.240

10.7

Cohere

Command A

$2.500

$10.000

9.7

Llama 3.2 11B Vision Instruct

$0.060

9.3

Mistral Large 2407

$2.000

$6.000

9.3

Mistral Small 3.1 24B

$0.100

$0.300

9.3

Nova Micro 1.0

$0.035

$0.140

8.0

Mistral Small 24B Instruct 2501

$0.050

$0.080

8.0

Llama 3.1 8B Instruct

$0.020

$0.050

7.7

Pixtral Large 2411

$2.000

$6.000

7.0

Llama 3.2 3B Instruct

$0.030

$0.050

6.7

Devstral Medium

$0.400

$2.000

6.7

Gemma 3 4B

$0.040

$0.080

6.3

AI21 Labs

Jamba Large 1.7

$2.000

$8.000

5.7

Qwen2.5 Coder 7B Instruct

$0.200

5.3

Claude 3.5 Haiku

$0.800

$4.000

3.3

Nous Research

Hermes 3 70B Instruct

$0.300

2.3

Claude 3 Haiku

$0.250

$1.250

1.0

Devstral Small 1.1

$0.070

$0.280

0.3

Mixtral 8x7B Instruct

$0.140

$0.420

Mistral Large

$0.500

$1.500

Mixtral 8x22B Instruct

$1.200

Llama 3 70B Instruct

$0.510

$0.740

$0.040

Llama 3.2 1B Instruct

$0.020