IFBench Leaderboard

MiMo v2.5 Pro

$1.000

$3.000

79.9

DeepSeek V4 Flash (Non-Reasoning)

$0.112

$0.224

79.2

Qwen3.5 397B A17B

$0.390

$0.900

78.8

Gemini 3 Flash Preview Thinking

$0.500

$3.000

78.0

GPT-5.2-Codex

$1.750

$14.000

77.6

Gemini 3.1 Flash Lite Preview

$0.250

$1.500

77.2

Gemini 3.1 Pro Preview

$2.000

$12.000

77.1

DeepSeek V4 Pro

$0.435

$0.870

76.5

GLM 5.1

$0.980

$3.080

76.3

Kimi K2.6

$0.730

$3.400

76.0

Qwen3.5-122B-A10B

$0.260

$0.900

75.7

MiniMax M2.7

$0.279

$1.200

75.7

Qwen3.5-27B

$0.195

$0.900

75.6

Gemma 4 31B Instruct

$0.120

$0.370

75.6

GPT-5 Mini

$0.250

$2.000

75.4

GPT-5.2 Pro

$10.500

$84.000

75.4

GPT-5.3 Codex

$1.750

$14.000

75.4

GPT-5 Codex

$1.250

$10.000

74.2

GPT-5.4

$2.500

$15.000

74.0

GLM-5 Turbo

$1.200

$4.000

73.2

$1.250

$10.000

73.1

GPT-5.1

$0.625

$5.000

72.9

Qwen3.5-35B-A3B

$0.140

$0.900

72.5

Gemma 4 26B A4B Instruct

$0.060

$0.300

72.5

MiniMax M2

$0.255

$1.000

72.3

GLM 5 Thinking

$0.600

$1.920

72.3

MiMo-V2-Flash

$0.100

$0.300

71.8

MiniMax M2.5

$0.150

$1.150

71.6

$2.000

$8.000

71.4

GPT-5 Mini

$0.250

$2.000

71.2

Nemotron 3 Nano 30B A3B Thinking

$0.050

$0.200

71.1

Qwen3 Max Thinking Thinking

$0.780

$3.900

70.8

$1.250

$10.000

70.6

Gemini 3 Pro Preview

$2.000

$12.000

70.4

$15.000

$60.000

70.3

Kimi K2.5 Thinking

$0.400

$1.900

70.2

GPT-5.1-Codex

$1.250

$10.000

70.0

MiniMax M2.1

$0.290

$0.950

69.9

Inception

Mercury 2

$0.250

$0.750

69.8

GPT-OSS-120b

$0.039

$0.180

69.0

o4 Mini

$1.100

$4.400

68.7

KwaiKAT

KAT-Coder-Pro V1

$0.207

$0.828

68.4

Kimi K2 0711

$0.550

$2.200

68.1

GPT-5.1-Codex-Mini

$0.250

$2.000

67.9

GLM 4.7 Thinking

$0.400

$1.750

67.9

GPT-5 Nano

$0.050

$0.400

67.5

o3 Mini High

$1.100

$4.400

67.1

Qwen3.5 9B

$0.040

$0.150

66.7

$1.250

$10.000

66.6

StepFun

Step 3.5 Flash

$0.100

$0.300

66.5

Olmo 3.1 32B Think

$0.150

$0.500

66.0

GPT-5 Nano

$0.050

$0.400

65.9

GPT-5.4

$2.500

$15.000

65.9

GPT-5.2

$0.875

$7.000

65.2

GPT-OSS-20b

$0.030

$0.140

65.1

StepFun

Step 3.5 Flash

$0.100

$0.300

64.6

Qwen3.6 35B A3B

$0.150

$0.900

64.3

MiMo-V2-Flash Thinking

$0.100

$0.300

64.2

DeepSeek V3.2 Speciale

$0.287

$0.431

63.9

GLM-5V Turbo

$1.200

$4.000

61.1

GLM-4.7-Flash Thinking

$0.060

$0.400

60.8

Qwen3 Next 80B A3B Thinking Thinking

$0.098

$0.300

60.7

DeepSeek V3.2 Thinking

$0.252

$0.378

60.7

Qwen3 VL 32B Instruct Thinking

$0.104

$0.416

59.4

Claude Opus 4.7

$5.000

$25.000

58.6

GPT-OSS-120b

$0.039

$0.180

58.3

Claude Opus 4.5 Thinking

$5.000

$25.000

58.0

GPT-OSS-20b

$0.030

$0.140

57.8

InclusionAI

Ling 2.6 Flash

$0.010

$0.030

57.4

Claude Sonnet 4.5 Thinking

$3.000

$15.000

57.3

DeepSeek V3.1 Terminus Thinking

$0.270

$0.950

57.0

Claude Sonnet 4.6

$3.000

$15.000

56.6

Qwen3 VL 235B A22B Thinking Thinking

$0.260

$0.900

56.5

Claude Opus 4.1 Thinking

$15.000

$75.000

55.4

GLM 5

$0.600

$1.920

55.2

Gemini 3 Flash Preview

$0.500

$3.000

55.1

Claude Sonnet 4 Thinking

$3.000

$15.000

54.7

GLM 4.7

$0.400

$1.750

54.6

Claude Haiku 4.5 Thinking

$1.000

$5.000

54.3

DeepSeek V3.2 Exp Thinking

$0.270

$0.410

54.1

Qwen3 Max Thinking

$0.780

$3.900

53.8

Claude Opus 4 Thinking

$15.000

$75.000

53.7

Grok 4

$3.000

$15.000

53.7

MiMo v2 Omni

$0.400

$2.000

53.5

Claude Opus 4.6 Thinking

$5.000

$25.000

53.1

Grok 4.1 Fast Thinking

$0.200

$0.500

52.7

Gemini 2.5 Flash Lite Preview 09-2025 Thinking

$0.100

$0.400

52.6

GLM 5.1

$0.980

$3.080

52.0

Qwen3.5 397B A17B

$0.390

$0.900

51.6

Qwen3 235B A22B Thinking 2507 Thinking

$0.149

$0.900

51.2

Qwen3.5-122B-A10B

$0.260

$0.900

50.8

Qwen3 30B A3B Thinking 2507 Thinking

$0.080

$0.300

50.7

Grok 4 Fast Thinking

$0.200

$0.500

50.5

Gemini 2.5 Flash Thinking

$0.300

$2.500

50.3

Gemini 2.5 Flash Lite Thinking

$0.100

$0.400

49.9

Qwen3 4B Thinking

$0.200

49.8

Gemini 3 Pro Preview

$2.000

$12.000

49.7

Olmo 3 32B Think

$0.150

$0.500

49.1

DeepSeek V3.2

$0.252

$0.378

49.0

Gemini 2.5 Pro

$1.000

$10.000

48.7

GPT-5.4

$2.500

$15.000

48.4

Claude 3.7 Sonnet Thinking

$3.000

$15.000

48.3

Qwen3 Max

$0.780

$3.900

48.0

GPT-5.2

$0.875

$7.000

47.4

DeepSeek V4 Flash (Non-Reasoning)

$0.112

$0.224

47.2

Llama 3.3 70B Instruct

$0.100

$0.320

47.1

Grok 3

$3.000

$15.000

46.9

Qwen3.5-27B

$0.195

$0.900

46.9

Cogito v2.1 671B Thinking

Deep Cogito

$0.900

46.3

GLM-4.7-Flash

$0.060

$0.400

46.3

Qwen3 235B A22B Instruct 2507

$0.071

$0.100

46.1

Grok 3 Mini

$0.250

$0.500

45.9

DeepSeek V4 Pro

$0.435

$0.870

45.8

$1.250

$10.000

45.6

Gemma 4 26B A4B Instruct

$0.060

$0.300

45.4

Claude Sonnet 4

$3.000

$15.000

45.4

Qwen3 VL 30B A3B Thinking Thinking

$0.130

$0.900

45.1

GPT-5 Chat

$1.250

$10.000

45.0

Claude Opus 4.6

$5.000

$25.000

44.6

Qwen3.5-35B-A3B

$0.140

$0.900

44.5

Kimi K2.6

$0.730

$3.400

44.3

Qwen3 Max

$0.780

$3.900

44.1

GLM 4.5 Thinking

$0.600

$2.200

44.1

Claude 3.7 Sonnet

$3.000

$15.000

44.0

Kimi K2.5

$0.400

$1.900

43.7

Claude Opus 4.7

$5.000

$25.000

43.6

GLM 4.6 Thinking

$0.390

$1.740

43.4

Claude Opus 4

$15.000

$75.000

43.3

GPT-5.1

$0.625

$5.000

43.2

DeepSeek V3.2 Exp

$0.270

$0.410

43.1

Llama 4 Maverick

$0.150

$0.600

43.0

GPT-4.1

$2.000

$8.000

43.0

Claude Opus 4.5

$5.000

$25.000

43.0

Claude 3.5 Haiku

$0.800

$4.000

42.8

MiMo v2.5 Pro

$1.000

$3.000

42.7

Qwen3 VL 235B A22B Instruct

$0.200

$0.880

42.6

Claude Sonnet 4.5

$3.000

$15.000

42.6

Claude Sonnet 4.6

$3.000

$15.000

42.4

Claude Haiku 4.5

$1.000

$5.000

42.0

Gemini 2.5 Flash Lite Preview 09-2025

$0.100

$0.400

41.8

MiniMax M1

$0.400

$2.200

41.8

Kimi K2 0905 (exacto)

$0.400

$2.000

41.7

Qwen3 30B A3B Thinking

$0.080

$0.280

41.5

Kimi K2 0711

$0.550

$2.200

41.5

DeepSeek V3.1 Thinking

$0.210

$0.790

41.5

Olmo 3 7B Think

$0.120

$0.200

41.5

Grok Code Fast 1

$0.200

$1.500

41.4

MiniMax M1

$0.400

$2.200

41.2

DeepSeek V3.1 Terminus

$0.270

$0.950

41.2

Claude Sonnet 4.6

$3.000

$15.000

41.2

DeepSeek V3 0324

$0.200

$0.770

41.0

Qwen3 14B Thinking

$0.060

$0.200

40.5

Nova 2 Lite

$0.300

$2.500

40.5

Qwen3 Coder 480B A35B (exacto)

$0.220

$0.900

40.5

Gemini 2.0 Flash

$0.100

$0.400

40.2

MiMo-V2-Flash

$0.100

$0.300

39.9

Qwen3 VL 8B Thinking Thinking

$0.117

$1.365

39.9

Mistral Medium 3.1

$0.400

$2.000

39.8

Qwen3 Next 80B A3B Instruct

$0.090

$0.780

39.7

R1 0528

$0.500

$2.150

39.6

Llama 4 Scout

$0.080

$0.300

39.5

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

39.5

Mistral Medium 3

$0.400

$2.000

39.3

Qwen3 VL 32B Instruct

$0.104

$0.416

39.2

Olmo 3.1 32B Instruct

$0.200

$0.600

39.2

Baidu

ERNIE 4.5 300B A47B

$0.280

$0.900

39.1

Llama 3.1 405B Instruct

$0.900

39.1

$0.550

$2.000

39.0

Gemini 2.5 Flash

$0.300

$2.500

39.0

QwQ 32B

$0.900

38.8

Qwen3 235B A22B Thinking

$0.455

$0.900

38.7

GPT-4.1 Mini

$0.200

$0.800

38.3

Nova Pro 1.0

$0.800

$3.200

38.1

Olmo 2 32B Instruct

$0.050

$0.200

38.1

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

38.1

Devstral 2 2512

$0.400

$0.900

38.1

DeepSeek V3.1

$0.210

$0.790

37.8

Qwen3.5 9B

$0.040

$0.150

37.8

Grok 4 Fast

$0.200

$0.500

37.7

GLM 4.5 Air

$0.130

$0.850

37.5

Nemotron 3 Nano 30B A3B

$0.050

$0.200

37.5

Llama 3 70B Instruct

$0.510

$0.740

37.1

Llama 3.3 Nemotron Super 49B V1.5 Thinking

$0.100

$0.400

37.0

Qwen2.5 72B Instruct

$0.360

$0.400

36.9

Gemma 3 12B

$0.040

$0.130

36.7

GLM 4.6

$0.390

$1.740

36.7

Qwen3 235B A22B

$0.455

$0.900

36.6

Cohere

Command A

$2.500

$10.000

36.5

Grok 4.1 Fast

$0.200

$0.500

36.5

Qwen3 32B Thinking

$0.080

$0.280

36.3

Nova Premier 1.0

$2.500

$12.500

36.2

Qwen3.6 35B A3B

$0.150

$0.900

36.2

Claude 3 Haiku

$0.250

$1.250

36.1

Qwen3 Coder Next

$0.110

$0.800

35.2

AI21 Labs

Jamba Large 1.7

$2.000

$8.000

35.2

DeepSeek V3 0324

$0.200

$0.770

34.8

Hermes 4 405B

$1.000

$3.000

34.8

Devstral Small 1.1

$0.070

$0.280

34.6

Pixtral Large 2411

$2.000

$6.000

34.5

Llama 3.1 70B Instruct

$0.340

$0.390

34.4

GLM 4.5V Thinking

$0.600

$1.800

34.2

Nova Lite 1.0

$0.060

$0.240

34.2

Prime Intellect

INTELLECT-3

$0.200

$1.100

34.0

Qwen3 4B

$0.200

33.5

Qwen3 8B Thinking

$0.050

$0.200

33.5

Mistral Small 3.2 24B

$0.075

$0.200

33.5

Qwen3 VL 30B A3B Instruct

$0.130

$0.520

33.1

Qwen3 30B A3B Instruct 2507

$0.090

$0.300

33.1

Llama 3.3 Nemotron Super 49B V1.5

$0.100

$0.400

32.9

Olmo 3 7B Instruct

$0.100

$0.200

32.8

Hermes 4 405B Thinking

$1.000

$3.000

32.7

Qwen3 Coder 30B A3B Instruct

$0.070

$0.270

32.6

Qwen3 4B Thinking

$0.200

32.5

GPT-5 Nano

$0.050

$0.400

32.5

Qwen3 VL 8B Instruct

$0.080

$0.200

32.3

GPT-4.1 Nano

$0.050

$0.200

32.0

Ministral 3 14B 2512

$0.200

32.0

Qwen3 30B A3B

$0.080

$0.280

31.9

Nemotron Nano 12B 2 VL Thinking

$0.200

31.9

Gemma 3 27B

$0.080

$0.160

31.8

Mistral Large 2407

$2.000

$6.000

31.6

Qwen3 32B

$0.080

$0.280

31.5

Gemini 2.5 Flash Lite

$0.100

$0.400

31.5

Hermes 4 70B Thinking

$0.130

$0.400

31.3

Mistral Large 2411

$2.000

$6.000

31.2

GPT-4o-mini

$0.150

$0.600

30.9

Llama 3.1 Nemotron 70B Instruct

$0.900

30.8

Llama 3.2 11B Vision Instruct

$0.060

30.4

GLM 4.6V Thinking

$0.300

$0.900

30.1

Mistral Small 3.1 24B

$0.100

$0.300

29.9

Devstral Medium

$0.400

$2.000

29.9

Nova Micro 1.0

$0.035

$0.140

29.4

Ministral 3 8B 2512

$0.150

29.1

Hermes 4 70B

$0.130

$0.400

29.0

GLM 4.5V

$0.600

$1.800

28.6

Llama 3.1 8B Instruct

$0.020

$0.050

28.6

Qwen3 8B

$0.050

$0.200

28.6

Gemma 3 4B

$0.040

$0.080

28.3

Gemma 3n 4B

$0.060

$0.120

27.9

GLM 4.6V

$0.300

$0.900

27.9

Nemotron Nano 9B V2 Thinking

$0.040

$0.160

27.6

R1 Distill Llama 70B

$0.700

$0.800

27.6

Nemotron Nano 9B V2

$0.040

$0.160

27.1

Molmo 2 8B

$0.200

26.9

Mistral Small 24B Instruct 2501

$0.050

$0.080

26.4

Liquid AI

LiquidAI/LFM2-8B-A1B

$0.010

$0.020

26.3

Llama 3.2 3B Instruct

$0.030

$0.050

26.2

Nemotron Nano 12B 2 VL

$0.200

25.9

Llama 3 8B Instruct

$0.040

24.6

Qwen3 14B

$0.060

$0.200

23.9

Microsoft

Phi 4

$0.065

$0.140

23.5

R1 Distill Qwen 32B

$0.290

22.9

Llama 3.2 1B Instruct

$0.020

22.8