WebDev AI Leaderboard - Best AI Models for Web Development

	Rank Spread
1	12	claude-opus-5-max Anthropic · Proprietary	1712+20/-20	1,278	$5 / $25	1M
2	13	kimi-k3-max Moonshot · Kimi K3 license	1682+13/-13	3,777	$3 / $15	1M
3	23	claude-opus-5-high Anthropic · Proprietary	1669+13/-13	2,855	$5 / $25	1M
4	45	claude-fable-5 Anthropic · Proprietary	1628+10/-10	5,887	$5 / $25	1M
5	45	gpt-5.6-sol-xhigh (codex-harness) OpenAI · Proprietary	1623+10/-10	5,460	$5 / $30	1.1M
6	66	glm-5.2-max Z.ai · MIT	1588+9/-9	5,865	$1.40 / $4.40	1M
7	710	claude-opus-4-8-thinking Anthropic · Proprietary	1568+8/-8	8,412	$2.50 / $12.50	1M
8	711	claude-opus-4-7 Anthropic · Proprietary	1560+7/-7	11,254	$5 / $25	1M
9	712	claude-opus-4-7-thinking Anthropic · Proprietary	1556+7/-7	11,838	$2.50 / $12.50	1M
10	716	grok-4.5 SpaceXAI · Proprietary	1550+11/-11	3,509	$2 / $6	500K
11	916	claude-opus-4-6-thinking Anthropic · Proprietary	1546+6/-6	13,772	$2.50 / $12.50	1M
12	819	claude-sonnet-5-high Anthropic · Proprietary	1544+10/-10	4,228	$1 / $5	1M
13	1020	claude-opus-4-8 Anthropic · Proprietary	1539+8/-8	7,359	$2.50 / $12.50	1M
14	1020	claude-opus-4-6 Anthropic · Proprietary	1538+6/-6	14,971	$2.50 / $12.50	1M
15	1022	muse-spark-1.1 Meta · Proprietary	1536+11/-11	3,397	$1.25 / $4.25	N/A
16	1024	gemini-3.6-flash Google · Proprietary	1528+13/-13	2,768	$0.75 / $3.75	1M
17	1223	seed-2.1-pro-preview Bytedance · Proprietary	1527+9/-9	5,092	N/A	N/A
18	1225	gpt-5.6-luna-xhigh (codex-harness) OpenAI · Proprietary	1525+13/-13	2,690	N/A	N/A
19	1523	claude-sonnet-4-6 Anthropic · Proprietary	1524+6/-6	16,915	$3 / $15	1M
20	1225	gpt-5.6-terra-xhigh (codex-harness) OpenAI · Proprietary	1522+13/-13	2,665	N/A	N/A
21	1525	glm-5.1 Z.ai · MIT	1518+8/-8	6,901	$1.40 / $4.40	202.8K
22	1328	hy3 Tencent · Apache 2.0	1517+17/-17	1,484	$0.13 / $0.53	262.1K
23	1625	qwen3.7-max-20260517 Alibaba · Proprietary	1517+8/-8	7,422	$1.48 / $4.42	1M
24	1827	kimi-k2.6 Moonshot · Modified MIT	1510+8/-8	9,255	$0.95 / $4	262.1K
25	1928	gpt-5.5-xhigh (codex-harness) OpenAI · Proprietary	1507+7/-7	10,342	$5 / $30	N/A
26	2332	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary	1494+8/-8	10,541	$5 / $25	200K
27	2432	minimax-m3 MiniMax · MiniMax Community License	1494+8/-8	7,658	$0.60 / $2.40	N/A
28	2335	gemini-3.5-flash Google · Proprietary	1492+14/-14	2,310	$0.75 / $4.50	1M
29	2635	gemini-3.5-flash-medium Google · Proprietary	1486+8/-8	6,811	$0.75 / $4.50	1M
30	2635	gpt-5.5-high (codex-harness) OpenAI · Proprietary	1485+7/-7	12,148	N/A	N/A
31	2637	qwen3.6-max-preview Alibaba · Proprietary	1478+13/-13	2,539	$1.03 / $6.16	262.1K
32	2837	mimo-v2.5-pro Xiaomi · MIT	1474+7/-7	10,850	$0.43 / $0.87	1.1M
33	2838	kimi-k2.7-code Moonshot · Modified MIT	1473+10/-10	4,535	$0.73 / $3.50	262.1K
34	3140	claude-opus-4-5-20251101 Anthropic · Proprietary	1467+7/-7	12,774	$5 / $25	200K
35	3140	deepseek-v4-pro-thinking DeepSeek · MIT	1464+7/-7	10,200	$0.43 / $0.87	1M
36	2847	gpt-5.4-high (codex-harness) OpenAI · Proprietary	1462+20/-20	1,259	$2.50 / $15	1.1M
37	3342	qwen3.6-plus Alibaba · Proprietary	1458+6/-6	12,998	$0.33 / $1.95	1M
38	3442	gpt-5.5 (codex-harness) OpenAI · Proprietary	1455+7/-7	10,479	N/A	N/A
39	2655	gemini-3.5-flash-lite Google · Proprietary	1454+44/-44	215	$0.15 / $1.25	1M
40	3650	deepseek-v4-pro DeepSeek · MIT	1447+7/-7	10,731	$0.43 / $0.87	1M
41	3650	gemini-3.1-pro-preview Google · Proprietary	1446+6/-6	18,070	$1 / $6	1M
42	3452	gpt-5.4-medium (codex-harness) OpenAI · Proprietary	1444+19/-19	1,296	$2.50 / $15	1.1M
43	3851	gemini-3-flash Google · Proprietary	1438+9/-9	10,418	$0.50 / $3	1M
44	3851	gemini-3-pro Google · Proprietary	1438+9/-9	13,486	$2 / $12	1M
45	3951	kimi-k2.5-thinking Moonshot · Modified MIT	1436+6/-6	15,482	$0.60 / $3	N/A
46	3851	mimo-v2.5 Xiaomi · MIT	1436+7/-7	9,807	$0.14 / $0.28	1.1M
47	3852	glm-5 Z.ai · MIT	1435+8/-8	6,967	$1 / $3.20	202.8K
48	3853	glm-4.7 Z.ai · MIT	1433+12/-12	3,796	$0.40 / $1.75	204.8K
49	3952	mimo-v2-pro Xiaomi · Proprietary	1433+8/-8	6,828	$1 / $3	1M
50	3963	gpt-5.2 OpenAI · Proprietary	1419+23/-23	1,049	$0.88 / $7	400K
51	4159	gpt-5-medium OpenAI · Proprietary	1419+16/-16	3,016	$0.63 / $5	400K
52	4556	inkling Thinky · Apache 2.0	1417+10/-10	4,243	$1 / $4.05	1M
53	4863	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1409+14/-14	2,501	$1.75 / $14	400K
54	4964	kimi-k2.5-instant Moonshot · Modified MIT	1405+12/-12	3,087	$0.57 / $2.85	262.1K
55	5164	qwen3.5-397b-a17b Alibaba · Apache 2.0	1401+6/-6	15,291	$0.39 / $2.34	262.1K
56	4966	glm-5v-turbo Z.ai · Proprietary	1400+14/-14	2,093	$1.20 / $4	202.8K
57	5164	gpt-5.4-mini-high OpenAI · Proprietary	1399+7/-7	10,897	$0.75 / $4.50	400K
58	5165	minimax-m2.7 MiniMax · Modified MIT	1398+7/-7	11,496	$0.25 / $1	204.8K
59	5266	claude-sonnet-4-5-20250929-thinking-32k Anthropic · Proprietary	1392+8/-8	12,732	$3 / $15	200K
60	5269	gpt-5.1-medium OpenAI · Proprietary	1390+12/-12	4,738	$0.63 / $5	400K
61	5071	gpt-5.4 OpenAI · Proprietary	1390+18/-18	1,152	$2.50 / $15	1.1M
62	5269	claude-opus-4-1-20250805 Anthropic · Proprietary	1389+11/-11	6,734	$15 / $75	200K
63	5269	minimax-m2.1-preview MiniMax · MIT	1388+10/-10	7,290	$0.30 / $1.20	204.8K
64	5469	minimax-m2.5 MiniMax · Modified MIT	1386+9/-9	7,162	$0.15 / $0.90	204.8K
65	5769	claude-sonnet-4-5-20250929 Anthropic · Proprietary	1385+7/-7	15,060	$3 / $15	200K
66	5869	gemini-3-flash (thinking-minimal) Google · Proprietary	1384+5/-5	20,478	$0.50 / $3	1M
67	6072	grok-4.20-beta-0309-reasoning SpaceXAI · Proprietary	1374+6/-6	14,052	$2 / $6	2M
68	6076	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1370+12/-12	3,414	$1.75 / $14	400K
69	6078	gemma-4-26b-a4b Google · Apache 2.0	1366+17/-17	1,416	N/A	N/A
70	6676	gemma-4-31b Google · Apache 2.0	1364+8/-8	7,086	$0.14 / $0.40	262.1K
71	6776	deepseek-v3.2-thinking DeepSeek · MIT	1361+9/-9	6,605	$0.27 / $0.40	163.8K
72	6876	qwen3.5-122b-a10b Alibaba · Apache 2.0	1360+8/-8	7,671	$0.26 / $2.08	262.1K
73	6876	grok-4.3 SpaceXAI · Proprietary	1358+7/-7	9,633	$1.25 / $2.50	1M
74	6878	qwen3.5-27b Alibaba · Apache 2.0	1357+8/-8	7,289	$0.20 / $1.56	262.1K
75	6681	hunyuan-hy3-preview Tencent · tencent-hunyuan-community	1357+18/-18	1,361	N/A	N/A
76	6881	laguna-m.1 Poolside · Apache 2.0	1349+10/-10	4,870	$0.20 / $0.40	262.1K
77	7381	gpt-5.1 OpenAI · Proprietary	1341+9/-9	10,272	$0.63 / $5	400K
78	7384	glm-4.6 Z.ai · MIT	1339+11/-11	6,567	$0.50 / $2	204.8K
79	7583	gpt-5.2-codex OpenAI · Proprietary	1338+9/-9	6,386	$1.75 / $14	400K
80	7584	gpt-5.1-codex OpenAI · Proprietary	1336+12/-12	4,831	$1.25 / $10	400K
81	7584	mimo-v2-flash (non-thinking) Xiaomi · MIT	1331+10/-10	5,412	$0.10 / $0.30	262.1K
82	7884	claude-haiku-4-5-20251001 Anthropic · Proprietary	1325+5/-5	23,627	$1 / $5	200K
83	7884	deepseek-v3.2 DeepSeek · MIT	1323+8/-8	8,895	$0.27 / $0.40	163.8K
84	7985	kimi-k2-thinking-turbo Moonshot · Modified MIT	1322+7/-7	12,530	$1.15 / $8	262.1K
85	8487	laguna-xs.2 Poolside · Apache 2.0	1304+11/-11	3,771	$0.10 / $0.20	262.1K
86	8587	minimax-m2 MiniMax · Apache 2.0	1297+11/-11	6,507	$0.26 / $1.02	204.8K
87	8591	mimo-v2-flash (thinking) Xiaomi · MIT	1291+17/-17	1,649	$0.10 / $0.30	262.1K
88	8793	qwen3-coder-480b-a35b-instruct Alibaba · Apache 2.0	1272+8/-8	12,217	$0.40 / $1.60	262.1K
89	8796	deepseek-v3.2-exp DeepSeek · MIT	1272+14/-14	3,844	$0.27 / $0.41	163.8K
90	8797	mistral-medium-3.5 Mistral · Modified MIT	1267+16/-16	2,074	$1.50 / $7.50	262.1K
91	8998	gemini-3.1-flash-lite-preview Google · Proprietary	1256+7/-7	13,296	$0.25 / $1.50	1M
92	87100	KAT-Coder-Pro-V1 Proprietary	1255+20/-20	1,449	$0.21 / $0.83	256K
93	88100	qwen3.5-35b-a3b Alibaba · Apache 2.0	1251+18/-18	1,521	$0.14 / $1	262.1K
94	88100	gpt-5.1-codex-mini OpenAI · Proprietary	1244+22/-22	1,127	$0.25 / $2	400K
95	91100	grok-4-1-fast-reasoning SpaceXAI · Proprietary	1240+11/-11	5,308	$0.20 / $0.50	2M
96	89100	trinity-large-thinking Apache 2.0	1239+21/-21	1,273	$0.22 / $0.85	262.1K
97	89100	qwen3.5-flash Alibaba · Proprietary	1238+20/-20	1,256	N/A	N/A
98	90102	mistral-large-3 Mistral · Apache 2.0	1230+26/-26	808	$0.50 / $1.50	N/A
99	92102	gemini-2.5-pro Google · Proprietary	1224+16/-16	2,657	$0.63 / $5	1M
100	92105	grok-4.1-thinking SpaceXAI · Proprietary	1210+25/-25	945	N/A	N/A
101	98105	granite-4.1-8b IBM · Apache 2.0	1195+19/-19	1,675	$0.05 / $0.10	131.1K
102	98105	devstral-2 Mistral · Modified MIT	1194+21/-21	1,139	N/A	N/A
103	100105	mercury-2 Inception AI · Proprietary	1166+26/-26	888	$0.25 / $0.75	128K
104	100105	grok-code-fast-1 SpaceXAI · Proprietary	1163+28/-28	782	$0.20 / $1.50	N/A
105	100105	grok-4-fast-reasoning SpaceXAI · Proprietary	1160+28/-28	731	$0.20 / $0.50	2M
106	106106	devstral-medium-2507 Mistral · Proprietary	1079+31/-31	825	$0.40 / $2	128K

Rank Spread

claude-opus-5-max

Anthropic · Proprietary

1712+20/-20

1,278

$5 / $25

kimi-k3-max

Moonshot · Kimi K3 license

1682+13/-13

3,777

$3 / $15

claude-opus-5-high

Anthropic · Proprietary

1669+13/-13

2,855

$5 / $25

claude-fable-5

Anthropic · Proprietary

1628+10/-10

5,887

$5 / $25

gpt-5.6-sol-xhigh (codex-harness)

OpenAI · Proprietary

1623+10/-10

5,460

$5 / $30

1.1M

glm-5.2-max

Z.ai · MIT

1588+9/-9

5,865

$1.40 / $4.40

710

claude-opus-4-8-thinking

Anthropic · Proprietary

1568+8/-8

8,412

$2.50 / $12.50

711

claude-opus-4-7

Anthropic · Proprietary

1560+7/-7

11,254

$5 / $25

712

claude-opus-4-7-thinking

Anthropic · Proprietary

1556+7/-7

11,838

$2.50 / $12.50

716

grok-4.5

SpaceXAI · Proprietary

1550+11/-11

3,509

$2 / $6

500K

916

claude-opus-4-6-thinking

Anthropic · Proprietary

1546+6/-6

13,772

$2.50 / $12.50

819

claude-sonnet-5-high

Anthropic · Proprietary

1544+10/-10

4,228

$1 / $5

1020

claude-opus-4-8

Anthropic · Proprietary

1539+8/-8

7,359

$2.50 / $12.50

1020

claude-opus-4-6

Anthropic · Proprietary

1538+6/-6

14,971

$2.50 / $12.50

1022

muse-spark-1.1

Meta · Proprietary

1536+11/-11

3,397

$1.25 / $4.25

N/A

1024

gemini-3.6-flash

Google · Proprietary

1528+13/-13

2,768

$0.75 / $3.75

1223

seed-2.1-pro-preview

Bytedance · Proprietary

1527+9/-9

5,092

N/A

1225

gpt-5.6-luna-xhigh (codex-harness)

OpenAI · Proprietary

1525+13/-13

2,690

N/A

1523

claude-sonnet-4-6

Anthropic · Proprietary

1524+6/-6

16,915

$3 / $15

1225

gpt-5.6-terra-xhigh (codex-harness)

OpenAI · Proprietary

1522+13/-13

2,665

N/A

1525

glm-5.1

Z.ai · MIT

1518+8/-8

6,901

$1.40 / $4.40

202.8K

1328

hy3

Tencent · Apache 2.0

1517+17/-17

1,484

$0.13 / $0.53

262.1K

1625

qwen3.7-max-20260517

Alibaba · Proprietary

1517+8/-8

7,422

$1.48 / $4.42

1827

kimi-k2.6

Moonshot · Modified MIT

1510+8/-8

9,255

$0.95 / $4

262.1K

1928

gpt-5.5-xhigh (codex-harness)

OpenAI · Proprietary

1507+7/-7

10,342

$5 / $30

N/A

2332

claude-opus-4-5-20251101-thinking-32k

Anthropic · Proprietary

1494+8/-8

10,541

$5 / $25

200K

2432

minimax-m3

MiniMax · MiniMax Community License

1494+8/-8

7,658

$0.60 / $2.40

N/A

2335

gemini-3.5-flash

Google · Proprietary

1492+14/-14

2,310

$0.75 / $4.50

2635

gemini-3.5-flash-medium

Google · Proprietary

1486+8/-8

6,811

$0.75 / $4.50

2635

gpt-5.5-high (codex-harness)

OpenAI · Proprietary

1485+7/-7

12,148

N/A

2637

qwen3.6-max-preview

Alibaba · Proprietary

1478+13/-13

2,539

$1.03 / $6.16

262.1K

2837

mimo-v2.5-pro

Xiaomi · MIT

1474+7/-7

10,850

$0.43 / $0.87

1.1M

2838

kimi-k2.7-code

Moonshot · Modified MIT

1473+10/-10

4,535

$0.73 / $3.50

262.1K

3140

claude-opus-4-5-20251101

Anthropic · Proprietary

1467+7/-7

12,774

$5 / $25

200K

3140

deepseek-v4-pro-thinking

DeepSeek · MIT

1464+7/-7

10,200

$0.43 / $0.87

2847

gpt-5.4-high (codex-harness)

OpenAI · Proprietary

1462+20/-20

1,259

$2.50 / $15

1.1M

3342

qwen3.6-plus

Alibaba · Proprietary

1458+6/-6

12,998

$0.33 / $1.95

3442

gpt-5.5 (codex-harness)

OpenAI · Proprietary

1455+7/-7

10,479

N/A

2655

gemini-3.5-flash-lite

Google · Proprietary

1454+44/-44

215

$0.15 / $1.25

3650

deepseek-v4-pro

DeepSeek · MIT

1447+7/-7

10,731

$0.43 / $0.87

3650

gemini-3.1-pro-preview

Google · Proprietary

1446+6/-6

18,070

$1 / $6

3452

gpt-5.4-medium (codex-harness)

OpenAI · Proprietary

1444+19/-19

1,296

$2.50 / $15

1.1M

3851

gemini-3-flash

Google · Proprietary

1438+9/-9

10,418

$0.50 / $3

3851

gemini-3-pro

Google · Proprietary

1438+9/-9

13,486

$2 / $12

3951

kimi-k2.5-thinking

Moonshot · Modified MIT

1436+6/-6

15,482

$0.60 / $3

N/A

3851

mimo-v2.5

Xiaomi · MIT

1436+7/-7

9,807

$0.14 / $0.28

1.1M

3852

glm-5

Z.ai · MIT

1435+8/-8

6,967

$1 / $3.20

202.8K

3853

glm-4.7

Z.ai · MIT

1433+12/-12

3,796

$0.40 / $1.75

204.8K

3952

mimo-v2-pro

Xiaomi · Proprietary

1433+8/-8

6,828

$1 / $3

3963

gpt-5.2

OpenAI · Proprietary

1419+23/-23

1,049

$0.88 / $7

400K

4159

gpt-5-medium

OpenAI · Proprietary

1419+16/-16

3,016

$0.63 / $5

400K

4556

inkling

Thinky · Apache 2.0

1417+10/-10

4,243

$1 / $4.05

4863

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1409+14/-14

2,501

$1.75 / $14

400K

4964

kimi-k2.5-instant

Moonshot · Modified MIT

1405+12/-12

3,087

$0.57 / $2.85

262.1K

5164

qwen3.5-397b-a17b

Alibaba · Apache 2.0

1401+6/-6

15,291

$0.39 / $2.34

262.1K

4966

glm-5v-turbo

Z.ai · Proprietary

1400+14/-14

2,093

$1.20 / $4

202.8K

5164

gpt-5.4-mini-high

OpenAI · Proprietary

1399+7/-7

10,897

$0.75 / $4.50

400K

5165

minimax-m2.7

MiniMax · Modified MIT

1398+7/-7

11,496

$0.25 / $1

204.8K

5266

claude-sonnet-4-5-20250929-thinking-32k

Anthropic · Proprietary

1392+8/-8

12,732

$3 / $15

200K

5269

gpt-5.1-medium

OpenAI · Proprietary

1390+12/-12

4,738

$0.63 / $5

400K

5071

gpt-5.4

OpenAI · Proprietary

1390+18/-18

1,152

$2.50 / $15

1.1M

5269

claude-opus-4-1-20250805

Anthropic · Proprietary

1389+11/-11

6,734

$15 / $75

200K

5269

minimax-m2.1-preview

MiniMax · MIT

1388+10/-10

7,290

$0.30 / $1.20

204.8K

5469

minimax-m2.5

MiniMax · Modified MIT

1386+9/-9

7,162

$0.15 / $0.90

204.8K

5769

claude-sonnet-4-5-20250929

Anthropic · Proprietary

1385+7/-7

15,060

$3 / $15

200K

5869

gemini-3-flash (thinking-minimal)

Google · Proprietary

1384+5/-5

20,478

$0.50 / $3

6072

grok-4.20-beta-0309-reasoning

SpaceXAI · Proprietary

1374+6/-6

14,052

$2 / $6

6076

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1370+12/-12

3,414

$1.75 / $14

400K

6078

gemma-4-26b-a4b

Google · Apache 2.0

1366+17/-17

1,416

N/A

6676

gemma-4-31b

Google · Apache 2.0

1364+8/-8

7,086

$0.14 / $0.40

262.1K

6776

deepseek-v3.2-thinking

DeepSeek · MIT

1361+9/-9

6,605

$0.27 / $0.40

163.8K

6876

qwen3.5-122b-a10b

Alibaba · Apache 2.0

1360+8/-8

7,671

$0.26 / $2.08

262.1K

6876

grok-4.3

SpaceXAI · Proprietary

1358+7/-7

9,633

$1.25 / $2.50

6878

qwen3.5-27b

Alibaba · Apache 2.0

1357+8/-8

7,289

$0.20 / $1.56

262.1K

6681

hunyuan-hy3-preview

Tencent · tencent-hunyuan-community

1357+18/-18

1,361

N/A

6881

laguna-m.1

Poolside · Apache 2.0

1349+10/-10

4,870

$0.20 / $0.40

262.1K

7381

gpt-5.1

OpenAI · Proprietary

1341+9/-9

10,272

$0.63 / $5

400K

7384

glm-4.6

Z.ai · MIT

1339+11/-11

6,567

$0.50 / $2

204.8K

7583

gpt-5.2-codex

OpenAI · Proprietary

1338+9/-9

6,386

$1.75 / $14

400K

7584

gpt-5.1-codex

OpenAI · Proprietary

1336+12/-12

4,831

$1.25 / $10

400K

7584

mimo-v2-flash (non-thinking)

Xiaomi · MIT

1331+10/-10

5,412

$0.10 / $0.30

262.1K

7884

claude-haiku-4-5-20251001

Anthropic · Proprietary

1325+5/-5

23,627

$1 / $5

200K

7884

deepseek-v3.2

DeepSeek · MIT

1323+8/-8

8,895

$0.27 / $0.40

163.8K

7985

kimi-k2-thinking-turbo

Moonshot · Modified MIT

1322+7/-7

12,530

$1.15 / $8

262.1K

8487

laguna-xs.2

Poolside · Apache 2.0

1304+11/-11

3,771

$0.10 / $0.20

262.1K

8587

minimax-m2

MiniMax · Apache 2.0

1297+11/-11

6,507

$0.26 / $1.02

204.8K

8591

mimo-v2-flash (thinking)

Xiaomi · MIT

1291+17/-17

1,649

$0.10 / $0.30

262.1K

8793

qwen3-coder-480b-a35b-instruct

Alibaba · Apache 2.0

1272+8/-8

12,217

$0.40 / $1.60

262.1K

8796

deepseek-v3.2-exp

DeepSeek · MIT

1272+14/-14

3,844

$0.27 / $0.41

163.8K

8797

mistral-medium-3.5

Mistral · Modified MIT

1267+16/-16

2,074

$1.50 / $7.50

262.1K

8998

gemini-3.1-flash-lite-preview

Google · Proprietary

1256+7/-7

13,296

$0.25 / $1.50

87100

KAT-Coder-Pro-V1

Proprietary

1255+20/-20

1,449

$0.21 / $0.83

256K

88100

qwen3.5-35b-a3b

Alibaba · Apache 2.0

1251+18/-18

1,521

$0.14 / $1

262.1K

88100

gpt-5.1-codex-mini

OpenAI · Proprietary

1244+22/-22

1,127

$0.25 / $2

400K

91100

grok-4-1-fast-reasoning

SpaceXAI · Proprietary

1240+11/-11

5,308

$0.20 / $0.50

89100

trinity-large-thinking

Apache 2.0

1239+21/-21

1,273

$0.22 / $0.85

262.1K

89100

qwen3.5-flash

Alibaba · Proprietary

1238+20/-20

1,256

N/A

90102

mistral-large-3

Mistral · Apache 2.0

1230+26/-26

808

$0.50 / $1.50

N/A

92102

gemini-2.5-pro

Google · Proprietary

1224+16/-16

2,657

$0.63 / $5

100

92105

grok-4.1-thinking

SpaceXAI · Proprietary

1210+25/-25

945

N/A

101

98105

granite-4.1-8b

IBM · Apache 2.0

1195+19/-19

1,675

$0.05 / $0.10

131.1K

102

98105

devstral-2

Mistral · Modified MIT

1194+21/-21

1,139

N/A

103

100105

mercury-2

Inception AI · Proprietary

1166+26/-26

888

$0.25 / $0.75

128K

104

100105

grok-code-fast-1

SpaceXAI · Proprietary

1163+28/-28

782

$0.20 / $1.50

N/A

105

100105

grok-4-fast-reasoning

SpaceXAI · Proprietary

1160+28/-28

731

$0.20 / $0.50

106

106106

devstral-medium-2507

Mistral · Proprietary

1079+31/-31

825

$0.40 / $2

128K

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Domain

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)