AIME 2025 Leaderboard

GPT-5.2 Pro

$10.500

$84.000

99.0

GPT-5 Codex

$1.250

$10.000

98.7

Gemini 3 Flash Preview Thinking

$0.500

$3.000

97.0

DeepSeek V3.2 Speciale

$0.270

$0.400

96.7

GPT-5.2

$1.750

$14.000

96.7

Xiaomi

MiMo-V2-Flash Thinking

$0.100

$0.300

96.3

GPT-5.1-Codex

$1.250

$10.000

95.7

Gemini 3 Pro Preview

$2.000

$12.000

95.7

GLM 4.7 Thinking

$0.400

$1.540

95.0

Kimi

Kimi K2 0711

$0.550

$2.200

94.7

KwaiKAT

KAT-Coder-Pro V1

$0.207

$0.828

94.7

$1.250

$10.000

94.3

GPT-5.1

$1.250

$10.000

94.0

GPT-OSS-120b

$0.039

$0.100

93.4

Grok 4

$3.000

$15.000

92.7

DeepSeek V3.2 Thinking

$0.229

$0.343

92.0

$1.250

$10.000

91.7

GPT-5.1-Codex-Mini

$0.250

$2.000

91.7

Claude Opus 4.5 Thinking

$5.000

$25.000

91.3

Qwen3 235B A22B Thinking 2507 Thinking

$0.100

91.0

Nemotron 3 Nano 30B A3B Thinking

$0.050

$0.200

91.0

o4 Mini

$0.550

$2.200

90.7

GPT-5 Mini

$0.250

$2.000

90.7

DeepSeek V3.1 Thinking

$0.210

$0.790

89.7

Grok 4 Fast Thinking

$0.200

$0.500

89.7

DeepSeek V3.1 Terminus Thinking

$0.270

$0.950

89.7

GPT-OSS-20b

$0.029

$0.140

89.3

Grok 4.1 Fast Thinking

$0.000

89.3

$2.000

$8.000

88.3

Qwen3 VL 235B A22B Thinking Thinking

$0.260

$0.900

88.3

Claude Sonnet 4.5 Thinking

$3.000

$15.000

88.0

Prime Intellect

INTELLECT-3

$0.200

$1.100

88.0

Gemini 2.5 Pro

$1.000

$10.000

87.7

DeepSeek V3.2 Exp Thinking

$0.270

$0.410

87.7

Gemini 3 Pro Preview

$2.000

$12.000

86.7

GLM 4.6 Thinking

$0.430

$1.740

86.0

GLM 4.6V Thinking

$0.300

$0.900

85.3

GPT-5 Mini

$0.250

$2.000

85.0

Grok 3 Mini

$0.250

$0.500

84.7

Qwen3 VL 32B Instruct Thinking

$0.104

$0.416

84.7

Qwen3 Next 80B A3B Thinking Thinking

$0.098

$0.300

84.3

GPT-5 Nano

$0.050

$0.400

83.7

Claude Haiku 4.5 Thinking

$1.000

$5.000

83.7

$1.250

$10.000

83.0

Qwen3 4B Thinking

$0.200

82.7

MiniMax M2.1

$0.290

$0.950

82.7

Qwen3 VL 30B A3B Thinking Thinking

$0.130

$0.900

82.3

Qwen3 Max Thinking Thinking

$0.780

$3.900

82.3

Qwen3 Max Thinking

$0.780

$3.900

82.3

Qwen3 235B A22B Thinking

$0.455

$0.900

82.0

GLM 4.5 Air

$0.125

$0.850

80.7

Qwen3 Max

$0.780

$3.900

80.7

Claude Opus 4.1 Thinking

$15.000

$75.000

80.3

GPT-5 Nano

$0.050

$0.400

78.3

MiniMax M2

$0.255

$1.000

78.3

Olmo 3.1 32B Think

$0.150

$0.500

77.3

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

76.7

R1 0528

$0.500

$2.150

76.0

Qwen3 Max

$0.780

$3.900

75.0

Nemotron Nano 12B 2 VL Thinking

$0.200

75.0

Claude Sonnet 4 Thinking

$3.000

$15.000

74.3

GLM 4.5 Thinking

$0.600

$2.200

73.7

Olmo 3 32B Think

$0.150

$0.500

73.7

Claude Opus 4 Thinking

$15.000

$75.000

73.3

Gemini 2.5 Flash Thinking

$0.300

$2.500

73.3

Qwen3 32B Thinking

$0.080

$0.280

73.0

GLM 4.5V Thinking

$0.600

$1.800

73.0

Cogito v2.1 671B Thinking

Deep Cogito

$0.900

72.7

Qwen3 30B A3B Thinking

$0.080

$0.280

72.3

Qwen3 VL 30B A3B Instruct

$0.130

$0.520

72.3

Qwen3 235B A22B Instruct 2507

$0.071

$0.100

71.7

Qwen3 VL 235B A22B Instruct

$0.200

$0.880

70.7

Olmo 3 7B Think

$0.120

$0.200

70.7

Hermes 4 405B Thinking

$1.000

$3.000

69.7

Nemotron Nano 9B V2 Thinking

$0.040

$0.160

69.7

Hermes 4 70B Thinking

$0.130

$0.400

68.7

Gemini 2.5 Flash Lite Preview 09-2025 Thinking

$0.100

$0.400

68.7

Qwen3 VL 32B Instruct

$0.104

$0.416

68.3

$0.550

$2.000

68.0

Xiaomi

MiMo-V2-Flash

$0.100

$0.300

67.7

Xiaomi

MiMo-V2-Flash

$0.100

$0.300

67.7

GPT-OSS-120b

$0.039

$0.100

66.7

Qwen3 30B A3B Instruct 2507

$0.043

$0.172

66.3

Qwen3 Next 80B A3B Instruct

$0.090

$0.780

66.3

R1 Distill Qwen 32B

$0.290

63.0

Claude Opus 4.5

$5.000

$25.000

62.7

GPT-OSS-20b

$0.029

$0.140

62.3

Nemotron Nano 9B V2

$0.040

$0.160

62.3

MiniMax M1

$0.400

$2.200

61.0

Gemini 2.5 Flash

$0.300

$2.500

60.3

DeepSeek V3.2

$0.229

$0.343

59.0

Qwen3 14B

$0.080

$0.200

58.0

Grok 3

$3.000

$15.000

58.0

DeepSeek V3.2 Exp

$0.270

$0.410

57.7

Kimi

Kimi K2 0905 (exacto)

$0.600

$2.500

57.3

Kimi

Kimi K2 0711

$0.550

$2.200

57.0

Claude 3.7 Sonnet Thinking

$3.000

$15.000

56.3

Qwen3 30B A3B Thinking 2507 Thinking

$0.080

$0.400

56.3

Qwen3 14B Thinking

$0.080

$0.200

55.7

Gemini 3 Flash Preview

$0.500

$3.000

55.7

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

54.7

R1 Distill Llama 70B

$0.700

$0.800

53.7

DeepSeek V3.1 Terminus

$0.270

$0.950

53.7

Gemini 2.5 Flash Lite Thinking

$0.100

$0.400

53.3

Qwen3 4B

$0.200

52.3

GPT-5.2

$1.750

$14.000

51.0

DeepSeek V3.1

$0.210

$0.790

49.7

GPT-5 Chat

$1.250

$10.000

48.3

GLM 4.7

$0.400

$1.540

48.0

Gemini 2.5 Flash Lite Preview 09-2025

$0.100

$0.400

46.7

GPT-4.1 Mini

$0.400

$1.600

46.3

GLM 4.6

$0.430

$1.740

44.3

Grok Code Fast 1

$0.200

$1.500

43.3

Baidu

ERNIE 4.5 300B A47B

$0.900

41.3

Grok 4 Fast

$0.200

$0.500

41.3

Olmo 3 7B Instruct

$0.100

$0.200

41.3

DeepSeek V3 0324

$0.200

$0.770

41.0

Qwen3 Coder 480B A35B (exacto)

$0.220

$0.900

39.3

Claude Haiku 4.5

$1.000

$5.000

39.0

Mistral Medium 3.1

$0.400

$2.000

38.3

Claude Sonnet 4

$3.000

$15.000

38.0

GPT-5.1

$1.250

$10.000

38.0

Claude Sonnet 4.5

$3.000

$15.000

37.0

Devstral 2 2512

$0.400

$0.900

36.7

Claude Opus 4

$15.000

$75.000

36.3

Gemini 2.5 Flash Lite

$0.100

$0.400

35.3

GPT-4.1

$2.000

$8.000

34.7

Grok 4.1 Fast

$0.000

34.3

Nova 2 Lite

$0.300

$2.500

33.7

$1.250

$10.000

31.7

Ministral 3 8B 2512

$0.150

31.7

Qwen3 VL 8B Thinking Thinking

$0.117

$1.365

30.7

Mistral Medium 3

$0.400

$2.000

30.3

Ministral 3 14B 2512

$0.200

30.0

Devstral Small 1.1

$0.070

$0.280

29.3

QwQ 32B

$0.900

29.0

Qwen3 Coder 30B A3B Instruct

$0.070

$0.270

29.0

GPT-5 Nano

$0.050

$0.400

27.3

Qwen3 VL 8B Instruct

$0.080

$0.200

27.3

Mistral Small 3.2 24B

$0.075

$0.200

27.0

Nemotron Nano 12B 2 VL

$0.200

26.7

GLM 4.6V

$0.300

$0.900

26.3

DeepSeek V3 0324

$0.200

$0.770

26.0

Liquid AI

LiquidAI/LFM2-8B-A1B

$0.010

$0.020

25.3

Qwen3 8B

$0.050

$0.200

24.3

GPT-4.1 Nano

$0.100

$0.400

24.0

Qwen3 235B A22B

$0.455

$0.900

23.7

Qwen3 4B Thinking

$0.200

22.3

Gemini 2.0 Flash

$0.100

$0.400

21.7

Qwen3 30B A3B

$0.080

$0.280

21.7

Claude 3.7 Sonnet

$3.000

$15.000

21.0

Gemma 3 27B

$0.080

$0.160

20.7

Qwen3 32B

$0.080

$0.280

19.7

Llama 4 Maverick

$0.150

$0.600

19.3

Qwen3 8B Thinking

$0.050

$0.200

19.0

Gemma 3 12B

$0.040

$0.130

18.3

Microsoft

Phi 4

$0.065

$0.140

18.0

Nova Premier 1.0

$2.500

$12.500

17.3

GLM 4.5V

$0.600

$1.800

15.3

Hermes 4 405B

$1.000

$3.000

15.3

GPT-4o-mini

$0.150

$0.600

14.7

Gemma 3n 4B

$0.060

$0.120

14.3

Qwen2.5 72B Instruct

$0.360

$0.400

14.0

Mistral Large 2411

$2.000

$6.000

14.0

Llama 4 Scout

$0.080

$0.300

14.0

MiniMax M1

$0.400

$2.200

13.7

Nemotron 3 Nano 30B A3B

$0.050

$0.200

13.3

Cohere

Command A

$2.500

$10.000

13.0

Gemma 3 4B

$0.040

$0.080

12.7

Hermes 4 70B

$0.130

$0.400

11.3

Llama 3.1 Nemotron 70B Instruct

$0.900

11.0

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

8.0

Llama 3.3 70B Instruct

$0.100

$0.320

7.7

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

7.7

Nova Pro 1.0

$0.800

$3.200

7.0

Nova Lite 1.0

$0.060

$0.240

7.0

Nova Micro 1.0

$0.035

$0.140

6.0

Devstral Medium

$0.400

$2.000

4.7

Llama 3.1 8B Instruct

$0.020

$0.050

4.3

Mistral Small 24B Instruct 2501

$0.050

$0.080

4.3

Llama 3.1 70B Instruct

$0.340

$0.390

4.0

Mistral Small 3.1 24B

$0.100

$0.300

3.7

Llama 3.2 3B Instruct

$0.030

$0.050

3.3

Olmo 2 32B Instruct

$0.050

$0.200

3.3

Llama 3.1 405B Instruct

$0.900

3.0

Pixtral Large 2411

$2.000

$6.000

2.3

AI21 Labs

Jamba Large 1.7

$2.000

$8.000

2.3

Llama 3.2 11B Vision Instruct

$0.060

1.7

Llama 3.2 1B Instruct

$0.020

Mistral Large 2407

$2.000

$6.000