Mathematics Leaderboard

GPT-5.2 Pro

$10.500

$84.000

99.0

GPT-5 Codex

$1.250

$10.000

98.7

DeepSeek V3.2 Speciale

$0.270

$0.400

96.7

GPT-5.1-Codex

$1.250

$10.000

95.7

Claude Opus 4.6 Thinking

$5.000

$25.000

95.6

Claude Opus 4.6

$5.000

$25.000

95.6

KwaiKAT

KAT-Coder-Pro V1

$0.207

$0.828

94.7

o4 Mini High

$1.100

$4.400

94.6

GLM 5 Thinking

$0.600

$2.080

94.0

GLM 5

$0.600

$2.080

94.0

o3 Mini

$0.550

$2.200

93.1

Qwen3 30B A3B Thinking

$0.080

$0.280

93.0

Qwen3 30B A3B

$0.080

$0.280

93.0

$0.550

$2.000

92.7

Grok 4

$3.000

$15.000

92.7

QwQ 32B

$0.900

92.1

QwQ 32B

$0.900

92.1

Xai

Grok 3 Beta

$3.000

$15.000

92.0

GPT-5.1-Codex-Mini

$0.250

$2.000

91.7

Claude Opus 4 Thinking

$15.000

$75.000

91.2

Claude Opus 4

$15.000

$75.000

91.2

Gemini 2.0 Flash

$0.100

$0.400

90.7

o4 Mini

$0.550

$2.200

90.7

Claude Sonnet 4 Thinking

$3.000

$15.000

90.3

Claude Sonnet 4

$3.000

$15.000

90.3

Claude 3.7 Sonnet Thinking

$3.000

$15.000

89.0

Claude 3.7 Sonnet

$3.000

$15.000

89.0

$2.000

$8.000

88.3

Prime Intellect

INTELLECT-3

$0.200

$1.100

88.0

Llama 4 Maverick

$0.150

$0.600

86.8

Gemini 3 Pro Preview

$2.000

$12.000

86.7

Gemini 3 Pro Preview

$2.000

$12.000

86.7

GPT-5 Mini

$0.250

$2.000

85.0

GPT-5 Mini

$0.250

$2.000

85.0

Gemma 3 27B

$0.080

$0.160

84.9

Grok 3 Mini

$0.250

$0.500

84.7

Mistral Medium 3

$0.400

$2.000

84.2

Deepseek

DeepSeek V3

$0.014

$0.028

83.1

MiniMax M2.1

$0.290

$0.950

82.7

Qwen3 Max Thinking Thinking

$0.780

$3.900

82.3

Qwen3 Max Thinking

$0.780

$3.900

82.3

GLM 4.5 Air

$0.125

$0.850

80.7

Llama 4 Scout

$0.080

$0.300

80.0

MiniMax M2

$0.255

$1.000

78.3

Microsoft

Phi 4

$0.065

$0.140

78.2

Olmo 3.1 32B Think

$0.150

$0.500

77.3

Cohere

Command A

$2.500

$10.000

77.2

R1 0528

$0.500

$2.150

76.0

Qwen3 Max

$0.780

$3.900

75.0

Qwen3 Max

$0.780

$3.900

75.0

Nova Pro 1.0

$0.800

$3.200

74.8

Llama 3.2 3B Instruct

$0.030

$0.050

74.4

Olmo 3 32B Think

$0.150

$0.500

73.7

Claude 3.5 Haiku

$0.800

$4.000

73.6

Qwen3 VL 30B A3B Instruct

$0.130

$0.520

72.3

Qwen3 235B A22B Instruct 2507

$0.071

$0.100

71.7

Gemini 2.5 Pro

$1.000

$10.000

70.8

Qwen3 VL 235B A22B Instruct

$0.200

$0.880

70.7

Olmo 3 7B Think

$0.120

$0.200

70.7

Nova Lite 1.0

$0.060

$0.240

70.1

Pixtral Large 2411

$2.000

$6.000

68.5

Qwen3 VL 32B Instruct Thinking

$0.104

$0.416

68.3

Qwen3 VL 32B Instruct

$0.104

$0.416

68.3

Xiaomi

MiMo-V2-Flash

$0.100

$0.300

67.7

Xiaomi

MiMo-V2-Flash Thinking

$0.100

$0.300

67.7

Xiaomi

MiMo-V2-Flash

$0.100

$0.300

67.7

Nova Micro 1.0

$0.035

$0.140

67.0

GPT-OSS-120b

$0.039

$0.100

66.7

GPT-OSS-120b

$0.039

$0.100

66.7

Qwen3 30B A3B Instruct 2507

$0.043

$0.172

66.3

Qwen3 Next 80B A3B Instruct

$0.090

$0.780

66.3

R1 Distill Qwen 32B

$0.290

63.0

Claude Opus 4.5 Thinking

$5.000

$25.000

62.7

Claude Opus 4.5

$5.000

$25.000

62.7

GPT-OSS-20b

$0.029

$0.140

62.3

GPT-OSS-20b

$0.029

$0.140

62.3

Nemotron Nano 9B V2 Thinking

$0.040

$0.160

62.3

Nemotron Nano 9B V2

$0.040

$0.160

62.3

DeepSeek V3.2 Thinking

$0.229

$0.343

59.0

DeepSeek V3.2

$0.229

$0.343

59.0

Qwen3 14B Thinking

$0.080

$0.200

58.0

Qwen3 14B

$0.080

$0.200

58.0

DeepSeek V3.2 Exp Thinking

$0.270

$0.410

57.7

DeepSeek V3.2 Exp

$0.270

$0.410

57.7

Kimi

Kimi K2 0905 (exacto)

$0.600

$2.500

57.3

Kimi

Kimi K2 0711

$0.550

$2.200

57.0

Kimi

Kimi K2 0711

$0.550

$2.200

57.0

Gemini 3 Flash Preview Thinking

$0.500

$3.000

55.7

Gemini 3 Flash Preview

$0.500

$3.000

55.7

R1 Distill Llama 70B

$0.700

$0.800

53.7

DeepSeek V3.1 Terminus Thinking

$0.270

$0.950

53.7

DeepSeek V3.1 Terminus

$0.270

$0.950

53.7

GPT-5.2

$1.750

$14.000

51.0

GPT-5.2

$1.750

$14.000

51.0

DeepSeek V3.1

$0.210

$0.790

49.7

DeepSeek V3.1 Thinking

$0.210

$0.790

49.7

GPT-5 Chat

$1.250

$10.000

48.3

GLM 4.7 Thinking

$0.400

$1.540

48.0

GLM 4.7

$0.400

$1.540

48.0

Gemini 2.5 Flash Lite Preview 09-2025 Thinking

$0.100

$0.400

46.7

Gemini 2.5 Flash Lite Preview 09-2025

$0.100

$0.400

46.7

GPT-4.1 Mini

$0.400

$1.600

46.3

GLM 4.6 Thinking

$0.430

$1.740

44.3

GLM 4.6

$0.430

$1.740

44.3

Grok Code Fast 1

$0.200

$1.500

43.3

Baidu

ERNIE 4.5 300B A47B

$0.900

41.3

Grok 4 Fast Thinking

$0.200

$0.500

41.3

Grok 4 Fast

$0.200

$0.500

41.3

Olmo 3 7B Instruct

$0.100

$0.200

41.3

Qwen3 Coder 480B A35B (exacto)

$0.220

$0.900

39.3

Claude Haiku 4.5 Thinking

$1.000

$5.000

39.0

Claude Haiku 4.5

$1.000

$5.000

39.0

Mistral Medium 3.1

$0.400

$2.000

38.3

GPT-5.1

$1.250

$10.000

38.0

GPT-5.1

$1.250

$10.000

38.0

Claude Sonnet 4.5 Thinking

$3.000

$15.000

37.0

Claude Sonnet 4.5

$3.000

$15.000

37.0

Inflection

Inflection 3 Pi

$2.500

$10.000

36.9

Devstral 2 2512

$0.400

$0.900

36.7

Gemini 2.5 Flash Lite Thinking

$0.100

$0.400

35.3

Gemini 2.5 Flash Lite

$0.100

$0.400

35.3

GPT-4.1

$2.000

$8.000

34.7

Grok 4.1 Fast Thinking

$0.000

34.3

Grok 4.1 Fast

$0.000

34.3

Nova 2 Lite

$0.300

$2.500

33.7

$1.250

$10.000

31.7

$1.250

$10.000

31.7

$1.250

$10.000

31.7

$1.250

$10.000

31.7

Ministral 3 8B 2512

$0.150

31.7

Ministral 3 14B 2512

$0.200

30.0

Devstral Small 1.1

$0.070

$0.280

29.3

Qwen3 Coder 30B A3B Instruct

$0.070

$0.270

29.0

GPT-5 Nano

$0.050

$0.400

27.3

GPT-5 Nano

$0.050

$0.400

27.3

GPT-5 Nano

$0.050

$0.400

27.3

Qwen3 VL 8B Instruct

$0.080

$0.200

27.3

Mistral Small 3.2 24B

$0.075

$0.200

27.0

Nemotron Nano 12B 2 VL Thinking

$0.200

26.7

Nemotron Nano 12B 2 VL

$0.200

26.7

GLM 4.6V Thinking

$0.300

$0.900

26.3

GLM 4.6V

$0.300

$0.900

26.3

DeepSeek V3 0324

$0.200

$0.770

26.0

DeepSeek V3 0324

$0.200

$0.770

26.0

Liquid AI

LiquidAI/LFM2-8B-A1B

$0.010

$0.020

25.3

Qwen3 8B Thinking

$0.050

$0.200

24.3

Qwen3 8B

$0.050

$0.200

24.3

GPT-4.1 Nano

$0.100

$0.400

24.0

Qwen3 235B A22B Thinking

$0.455

$0.900

23.7

Qwen3 235B A22B

$0.455

$0.900

23.7

Qwen3 32B Thinking

$0.080

$0.280

19.7

Qwen3 32B

$0.080

$0.280

19.7

Gemma 3 12B

$0.040

$0.130

18.3

Nova Premier 1.0

$2.500

$12.500

17.3

GLM 4.5V Thinking

$0.600

$1.800

15.3

GLM 4.5V

$0.600

$1.800

15.3

Hermes 4 405B Thinking

$1.000

$3.000

15.3

Hermes 4 405B

$1.000

$3.000

15.3

GPT-4o-mini

$0.150

$0.600

14.7

Gemma 3n 4B

$0.060

$0.120

14.3

Qwen2.5 72B Instruct

$0.360

$0.400

14.0

Mistral Large 2411

$2.000

$6.000

14.0

MiniMax M1

$0.400

$2.200

13.7

MiniMax M1

$0.400

$2.200

13.7

Nemotron 3 Nano 30B A3B Thinking

$0.050

$0.200

13.3

Nemotron 3 Nano 30B A3B

$0.050

$0.200

13.3

Gemma 3 4B

$0.040

$0.080

12.7

Hermes 4 70B Thinking

$0.130

$0.400

11.3

Hermes 4 70B

$0.130

$0.400

11.3

Llama 3.1 Nemotron 70B Instruct

$0.900

11.0

Llama 3.3 70B Instruct

$0.100

$0.320

7.7

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

7.7

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

7.7

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

7.7

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

7.7

Devstral Medium

$0.400

$2.000

4.7

Llama 3.1 8B Instruct

$0.020

$0.050

4.3

Mistral Small 24B Instruct 2501

$0.050

$0.080

4.3

Llama 3.1 70B Instruct

$0.340

$0.390

4.0

Mistral Small 3.1 24B

$0.100

$0.300

3.7

Olmo 2 32B Instruct

$0.050

$0.200

3.3

Llama 3.1 405B Instruct

$0.900

3.0

AI21 Labs

Jamba Large 1.7

$2.000

$8.000

2.3

Llama 3.2 11B Vision Instruct

$0.060

1.7

Llama 3.2 1B Instruct

$0.020

Mistral Large 2407

$2.000

$6.000