Code Arena | WebDev🏆Overall

View overall rankings across AI models on front-end web development tasks, including agentic coding workflows that require multi-step reasoning and tool use.

Jun 19, 2026

391,241 votes

90 models

Rank by

	Rank Spread
1	11	claude-fable-5 Anthropic · Proprietary	1654+16/-16	2,095	$10 / $50	1M
2	22	glm-5.2 (max) Z.ai · MIT	1593+15/-15	1,994	$1.40 / $4.40	1M
3	36	claude-opus-4-8-thinking Anthropic · Proprietary	1565+12/-12	3,005	$5 / $25	1M
4	35	claude-opus-4-7-thinking Anthropic · Proprietary	1563+8/-8	7,823	$5 / $25	1M
5	38	claude-opus-4-7 Anthropic · Proprietary	1557+8/-8	7,251	$5 / $25	1M
6	511	claude-opus-4-8 Anthropic · Proprietary	1542+11/-11	3,441	$5 / $25	1M
7	511	claude-opus-4-6-thinking Anthropic · Proprietary	1542+7/-7	10,294	$5 / $25	1M
8	412	seed-2.1-pro-preview Bytedance · Proprietary	1539+15/-15	1,640	N/A	N/A
9	611	claude-opus-4-6 Anthropic · Proprietary	1538+7/-7	11,424	$5 / $25	1M
10	613	qwen3.7-max-20260517 Alibaba · Proprietary	1530+11/-11	3,713	$1.25 / $3.75	1M
11	614	glm-5.1 Z.ai · MIT	1529+11/-11	3,760	$1.40 / $4.40	202.8K
12	915	claude-sonnet-4-6 Anthropic · Proprietary	1521+6/-6	13,612	$3 / $15	1M
13	1016	kimi-k2.6 Moonshot · Modified MIT	1513+8/-8	5,953	$0.95 / $4	262.1K
14	1118	gemini-3.5-flash Google · Proprietary	1506+13/-13	2,217	$1.50 / $9	1M
15	1218	minimax-m3 MiniMax · Proprietary	1505+11/-11	3,236	$0.60 / $2.40	N/A
16	1318	gpt-5.5-xhigh (codex-harness) OpenAI · Proprietary	1502+8/-8	6,535	N/A	N/A
17	1420	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary	1490+7/-7	13,059	$5 / $25	200K
18	1721	gpt-5.5-high (codex-harness) OpenAI · Proprietary	1484+8/-8	6,726	N/A	N/A
19	1423	qwen3.6-max-preview Alibaba · Proprietary	1483+12/-12	2,507	$1.04 / $6.24	262.1K
20	1725	kimi-k2.7-code Moonshot · Modified MIT	1479+13/-13	2,281	$0.61 / $3.07	262.1K
21	1825	mimo-v2.5-pro Xiaomi · MIT	1471+8/-8	6,887	$0.43 / $0.87	1M
22	1925	claude-opus-4-5-20251101 Anthropic · Proprietary	1466+6/-6	15,305	$5 / $25	200K
23	2026	qwen3.6-plus Alibaba · Proprietary	1462+7/-7	8,408	$0.33 / $1.95	1M
24	2029	deepseek-v4-pro-thinking DeepSeek · MIT	1458+8/-8	6,256	$0.43 / $0.87	1M
25	1934	gpt-5.4-high (codex-harness) OpenAI · Proprietary	1457+17/-17	1,482	$2.50 / $15	1.1M
26	2332	gpt-5.5 (codex-harness) OpenAI · Proprietary	1449+8/-8	6,569	N/A	N/A
27	2432	gemini-3.1-pro-preview Google · Proprietary	1447+6/-6	12,948	$2 / $12	1M
28	2436	glm-4.7 Z.ai · MIT	1440+10/-10	4,883	$0.40 / $1.75	202.8K
29	2536	gemini-3-pro Google · Proprietary	1439+7/-7	17,158	$2 / $12	1M
30	2437	gpt-5.4-medium (codex-harness) OpenAI · Proprietary	1437+16/-16	1,449	$2.50 / $15	1.1M
31	2536	gemini-3-flash Google · Proprietary	1437+7/-7	13,277	$0.50 / $3	1M
32	2536	glm-5 Z.ai · MIT	1434+8/-8	6,715	$1 / $3.20	202.8K
33	2736	mimo-v2-pro Xiaomi · Proprietary	1432+8/-8	6,787	$1 / $3	1M
34	2736	mimo-v2.5 Xiaomi · MIT	1432+8/-8	5,996	$0.14 / $0.28	1M
35	2836	kimi-k2.5-thinking Moonshot · Modified MIT	1431+6/-6	12,739	$0.60 / $3	N/A
36	2851	gpt-5.4 OpenAI · Proprietary	1411+27/-27	505	$2.50 / $15	1.1M
37	3645	kimi-k2.5-instant Moonshot · Modified MIT	1408+11/-11	3,610	$0.38 / $2.02	262.1K
38	3647	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1407+12/-12	2,965	$1.75 / $14	400K
39	3551	gpt-5.2 OpenAI · Proprietary	1405+17/-17	1,457	$1.75 / $14	400K
40	3650	gpt-5.4-mini-high OpenAI · Proprietary	1398+8/-8	7,713	$0.75 / $4.50	400K
41	3651	minimax-m2.7 MiniMax · Modified MIT	1395+7/-7	8,265	$0.25 / $1	204.8K
42	3651	qwen3.5-397b-a17b Alibaba · Apache 2.0	1395+6/-6	11,997	$0.39 / $2.45	256K
43	3653	gpt-5-medium OpenAI · Proprietary	1394+13/-13	3,755	$1.25 / $10	400K
44	3651	minimax-m2.1-preview MiniMax · MIT	1392+8/-8	9,273	$0.29 / $0.95	204.8K
45	3653	gpt-5.1-medium OpenAI · Proprietary	1391+9/-9	6,119	$1.25 / $10	400K
46	3753	claude-sonnet-4-5-20250929-thinking-32k Anthropic · Proprietary	1388+7/-7	15,741	$3 / $15	200K
47	3853	gemini-3-flash (thinking-minimal) Google · Proprietary	1388+5/-5	18,792	$0.50 / $3	1M
48	3754	claude-opus-4-1-20250805 Anthropic · Proprietary	1386+9/-9	8,568	$15 / $75	200K
49	3854	claude-sonnet-4-5-20250929 Anthropic · Proprietary	1386+6/-6	18,390	$3 / $15	200K
50	3854	grok-4.20-beta-0309-reasoning xAI · Proprietary	1385+7/-7	9,535	$2 / $6	2M
51	3956	minimax-m2.5 MiniMax · Modified MIT	1382+8/-8	7,838	$0.15 / $0.90	204.8K
52	4459	gemma-4-31b Google · Apache 2.0	1374+9/-9	4,802	$0.14 / $0.40	262.1K
53	4461	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1372+11/-11	3,553	$1.75 / $14	400K
54	5161	deepseek-v3.2-thinking DeepSeek · MIT	1368+8/-8	7,911	$0.23 / $0.34	131.1K
55	5261	qwen3.5-122b-a10b Alibaba · Apache 2.0	1364+7/-7	8,152	$0.26 / $2.08	262.1K
56	5261	grok-4.3 xAI · Proprietary	1364+9/-9	5,821	$1.25 / $2.50	1M
57	4862	hunyuan-hy3-preview Tencent · tencent-hunyuan-community	1363+17/-17	1,352	N/A	N/A
58	5163	gemma-4-26b-a4b Google · Apache 2.0	1359+16/-16	1,505	N/A	N/A
59	5361	qwen3.5-27b Alibaba · Apache 2.0	1357+8/-8	7,662	$0.20 / $1.56	262.1K
60	5362	glm-4.6 Z.ai · MIT	1355+9/-9	8,350	$0.43 / $1.74	202.8K
61	5266	laguna-m.1 Poolside · Proprietary	1351+14/-14	1,905	$0.20 / $0.40	262.1K
62	5867	gpt-5.1 OpenAI · Proprietary	1340+7/-7	12,865	$1.25 / $10	400K
63	6068	mimo-v2-flash (non-thinking) Xiaomi · MIT	1337+8/-8	6,727	$0.10 / $0.30	262.1K
64	6168	gpt-5.2-codex OpenAI · Proprietary	1335+8/-8	7,764	$1.75 / $14	400K
65	6168	deepseek-v3.2 DeepSeek · MIT	1332+7/-7	10,470	$0.23 / $0.34	131.1K
66	6168	gpt-5.1-codex OpenAI · Proprietary	1330+10/-10	6,217	$1.25 / $10	400K
67	6268	kimi-k2-thinking-turbo Moonshot · Modified MIT	1329+6/-6	15,346	$1.15 / $8	262.1K
68	6368	claude-haiku-4-5-20251001 Anthropic · Proprietary	1326+5/-5	22,687	$1 / $5	200K
69	6972	minimax-m2 MiniMax · Apache 2.0	1305+9/-9	8,402	$0.26 / $1	204.8K
70	6973	mimo-v2-flash (thinking) Xiaomi · MIT	1301+14/-14	2,098	$0.10 / $0.30	262.1K
71	6973	laguna-xs.2 Poolside · Apache 2.0	1299+14/-14	2,350	$0.10 / $0.20	262.1K
72	6974	deepseek-v3.2-exp DeepSeek · MIT	1287+11/-11	4,873	$0.27 / $0.41	163.8K
73	7074	qwen3-coder-480b-a35b-instruct Alibaba · Apache 2.0	1282+7/-7	15,211	$0.40 / $1.60	262.1K
74	7280	mistral-medium-3.5 Mistral · Modified MIT	1268+15/-15	2,022	$1.50 / $7.50	262.1K
75	7480	KAT-Coder-Pro-V1 KwaiKAT · Proprietary	1259+16/-16	1,881	$0.21 / $0.83	256K
76	7482	qwen3.5-35b-a3b Alibaba · Apache 2.0	1249+16/-16	1,814	$0.14 / $1	262.1K
77	7482	gemini-3.1-flash-lite-preview Google · Proprietary	1249+7/-7	11,736	$0.25 / $1.50	1M
78	7483	trinity-large-thinking Arcee AI · Apache 2.0	1244+19/-19	1,310	$0.25 / $0.80	262.1K
79	7483	gpt-5.1-codex-mini OpenAI · Proprietary	1240+17/-17	1,444	$0.25 / $2	400K
80	7483	qwen3.5-flash Alibaba · Proprietary	1238+17/-17	1,563	N/A	N/A
81	7683	grok-4-1-fast-reasoning xAI · Proprietary	1234+9/-9	6,911	$0.20 / $0.50	2M
82	7686	mistral-large-3 Mistral · Apache 2.0	1223+20/-20	1,032	$0.50 / $1.50	N/A
83	7886	grok-4.1-thinking xAI · Proprietary	1209+20/-20	1,209	N/A	N/A
84	8286	gemini-2.5-pro Google · Proprietary	1204+13/-13	3,300	$1.25 / $10	1M
85	8287	granite-4.1-8b IBM · Apache 2.0	1201+18/-18	1,728	$0.05 / $0.10	131.1K
86	8287	devstral-2 Mistral · Modified MIT	1199+17/-17	1,585	N/A	N/A
87	8589	mercury-2 Inception AI · Proprietary	1165+23/-23	948	$0.25 / $0.75	128K
88	8789	grok-4-fast-reasoning xAI · Proprietary	1150+23/-23	934	$0.20 / $0.50	2M
89	8789	grok-code-fast-1 xAI · Proprietary	1140+22/-22	982	$0.20 / $1.50	N/A
90	9090	devstral-medium-2507 Mistral · Proprietary	1092+23/-23	992	$0.40 / $2	128K

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Rank Spread

claude-fable-5

Anthropic · Proprietary

1654+16/-16

2,095

$10 / $50

glm-5.2 (max)

Z.ai · MIT

1593+15/-15

1,994

$1.40 / $4.40

claude-opus-4-8-thinking

Anthropic · Proprietary

1565+12/-12

3,005

$5 / $25

claude-opus-4-7-thinking

Anthropic · Proprietary

1563+8/-8

7,823

$5 / $25

claude-opus-4-7

Anthropic · Proprietary

1557+8/-8

7,251

$5 / $25

511

claude-opus-4-8

Anthropic · Proprietary

1542+11/-11

3,441

$5 / $25

511

claude-opus-4-6-thinking

Anthropic · Proprietary

1542+7/-7

10,294

$5 / $25

412

seed-2.1-pro-preview

Bytedance · Proprietary

1539+15/-15

1,640

N/A

611

claude-opus-4-6

Anthropic · Proprietary

1538+7/-7

11,424

$5 / $25

613

qwen3.7-max-20260517

Alibaba · Proprietary

1530+11/-11

3,713

$1.25 / $3.75

614

glm-5.1

Z.ai · MIT

1529+11/-11

3,760

$1.40 / $4.40

202.8K

915

claude-sonnet-4-6

Anthropic · Proprietary

1521+6/-6

13,612

$3 / $15

1016

kimi-k2.6

Moonshot · Modified MIT

1513+8/-8

5,953

$0.95 / $4

262.1K

1118

gemini-3.5-flash

Google · Proprietary

1506+13/-13

2,217

$1.50 / $9

1218

minimax-m3

MiniMax · Proprietary

1505+11/-11

3,236

$0.60 / $2.40

N/A

1318

gpt-5.5-xhigh (codex-harness)

OpenAI · Proprietary

1502+8/-8

6,535

N/A

1420

claude-opus-4-5-20251101-thinking-32k

Anthropic · Proprietary

1490+7/-7

13,059

$5 / $25

200K

1721

gpt-5.5-high (codex-harness)

OpenAI · Proprietary

1484+8/-8

6,726

N/A

1423

qwen3.6-max-preview

Alibaba · Proprietary

1483+12/-12

2,507

$1.04 / $6.24

262.1K

1725

kimi-k2.7-code

Moonshot · Modified MIT

1479+13/-13

2,281

$0.61 / $3.07

262.1K

1825

mimo-v2.5-pro

Xiaomi · MIT

1471+8/-8

6,887

$0.43 / $0.87

1925

claude-opus-4-5-20251101

Anthropic · Proprietary

1466+6/-6

15,305

$5 / $25

200K

2026

qwen3.6-plus

Alibaba · Proprietary

1462+7/-7

8,408

$0.33 / $1.95

2029

deepseek-v4-pro-thinking

DeepSeek · MIT

1458+8/-8

6,256

$0.43 / $0.87

1934

gpt-5.4-high (codex-harness)

OpenAI · Proprietary

1457+17/-17

1,482

$2.50 / $15

1.1M

2332

gpt-5.5 (codex-harness)

OpenAI · Proprietary

1449+8/-8

6,569

N/A

2432

gemini-3.1-pro-preview

Google · Proprietary

1447+6/-6

12,948

$2 / $12

2436

glm-4.7

Z.ai · MIT

1440+10/-10

4,883

$0.40 / $1.75

202.8K

2536

gemini-3-pro

Google · Proprietary

1439+7/-7

17,158

$2 / $12

2437

gpt-5.4-medium (codex-harness)

OpenAI · Proprietary

1437+16/-16

1,449

$2.50 / $15

1.1M

2536

gemini-3-flash

Google · Proprietary

1437+7/-7

13,277

$0.50 / $3

2536

glm-5

Z.ai · MIT

1434+8/-8

6,715

$1 / $3.20

202.8K

2736

mimo-v2-pro

Xiaomi · Proprietary

1432+8/-8

6,787

$1 / $3

2736

mimo-v2.5

Xiaomi · MIT

1432+8/-8

5,996

$0.14 / $0.28

2836

kimi-k2.5-thinking

Moonshot · Modified MIT

1431+6/-6

12,739

$0.60 / $3

N/A

2851

gpt-5.4

OpenAI · Proprietary

1411+27/-27

505

$2.50 / $15

1.1M

3645

kimi-k2.5-instant

Moonshot · Modified MIT

1408+11/-11

3,610

$0.38 / $2.02

262.1K

3647

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1407+12/-12

2,965

$1.75 / $14

400K

3551

gpt-5.2

OpenAI · Proprietary

1405+17/-17

1,457

$1.75 / $14

400K

3650

gpt-5.4-mini-high

OpenAI · Proprietary

1398+8/-8

7,713

$0.75 / $4.50

400K

3651

minimax-m2.7

MiniMax · Modified MIT

1395+7/-7

8,265

$0.25 / $1

204.8K

3651

qwen3.5-397b-a17b

Alibaba · Apache 2.0

1395+6/-6

11,997

$0.39 / $2.45

256K

3653

gpt-5-medium

OpenAI · Proprietary

1394+13/-13

3,755

$1.25 / $10

400K

3651

minimax-m2.1-preview

MiniMax · MIT

1392+8/-8

9,273

$0.29 / $0.95

204.8K

3653

gpt-5.1-medium

OpenAI · Proprietary

1391+9/-9

6,119

$1.25 / $10

400K

3753

claude-sonnet-4-5-20250929-thinking-32k

Anthropic · Proprietary

1388+7/-7

15,741

$3 / $15

200K

3853

gemini-3-flash (thinking-minimal)

Google · Proprietary

1388+5/-5

18,792

$0.50 / $3

3754

claude-opus-4-1-20250805

Anthropic · Proprietary

1386+9/-9

8,568

$15 / $75

200K

3854

claude-sonnet-4-5-20250929

Anthropic · Proprietary

1386+6/-6

18,390

$3 / $15

200K

3854

grok-4.20-beta-0309-reasoning

xAI · Proprietary

1385+7/-7

9,535

$2 / $6

3956

minimax-m2.5

MiniMax · Modified MIT

1382+8/-8

7,838

$0.15 / $0.90

204.8K

4459

gemma-4-31b

Google · Apache 2.0

1374+9/-9

4,802

$0.14 / $0.40

262.1K

4461

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1372+11/-11

3,553

$1.75 / $14

400K

5161

deepseek-v3.2-thinking

DeepSeek · MIT

1368+8/-8

7,911

$0.23 / $0.34

131.1K

5261

qwen3.5-122b-a10b

Alibaba · Apache 2.0

1364+7/-7

8,152

$0.26 / $2.08

262.1K

5261

grok-4.3

xAI · Proprietary

1364+9/-9

5,821

$1.25 / $2.50

4862

hunyuan-hy3-preview

Tencent · tencent-hunyuan-community

1363+17/-17

1,352

N/A

5163

gemma-4-26b-a4b

Google · Apache 2.0

1359+16/-16

1,505

N/A

5361

qwen3.5-27b

Alibaba · Apache 2.0

1357+8/-8

7,662

$0.20 / $1.56

262.1K

5362

glm-4.6

Z.ai · MIT

1355+9/-9

8,350

$0.43 / $1.74

202.8K

5266

laguna-m.1

Poolside · Proprietary

1351+14/-14

1,905

$0.20 / $0.40

262.1K

5867

gpt-5.1

OpenAI · Proprietary

1340+7/-7

12,865

$1.25 / $10

400K

6068

mimo-v2-flash (non-thinking)

Xiaomi · MIT

1337+8/-8

6,727

$0.10 / $0.30

262.1K

6168

gpt-5.2-codex

OpenAI · Proprietary

1335+8/-8

7,764

$1.75 / $14

400K

6168

deepseek-v3.2

DeepSeek · MIT

1332+7/-7

10,470

$0.23 / $0.34

131.1K

6168

gpt-5.1-codex

OpenAI · Proprietary

1330+10/-10

6,217

$1.25 / $10

400K

6268

kimi-k2-thinking-turbo

Moonshot · Modified MIT

1329+6/-6

15,346

$1.15 / $8

262.1K

6368

claude-haiku-4-5-20251001

Anthropic · Proprietary

1326+5/-5

22,687

$1 / $5

200K

6972

minimax-m2

MiniMax · Apache 2.0

1305+9/-9

8,402

$0.26 / $1

204.8K

6973

mimo-v2-flash (thinking)

Xiaomi · MIT

1301+14/-14

2,098

$0.10 / $0.30

262.1K

6973

laguna-xs.2

Poolside · Apache 2.0

1299+14/-14

2,350

$0.10 / $0.20

262.1K

6974

deepseek-v3.2-exp

DeepSeek · MIT

1287+11/-11

4,873

$0.27 / $0.41

163.8K

7074

qwen3-coder-480b-a35b-instruct

Alibaba · Apache 2.0

1282+7/-7

15,211

$0.40 / $1.60

262.1K

7280

mistral-medium-3.5

Mistral · Modified MIT

1268+15/-15

2,022

$1.50 / $7.50

262.1K

7480

KAT-Coder-Pro-V1

KwaiKAT · Proprietary

1259+16/-16

1,881

$0.21 / $0.83

256K

7482

qwen3.5-35b-a3b

Alibaba · Apache 2.0

1249+16/-16

1,814

$0.14 / $1

262.1K

7482

gemini-3.1-flash-lite-preview

Google · Proprietary

1249+7/-7

11,736

$0.25 / $1.50

7483

trinity-large-thinking

Arcee AI · Apache 2.0

1244+19/-19

1,310

$0.25 / $0.80

262.1K

7483

gpt-5.1-codex-mini

OpenAI · Proprietary

1240+17/-17

1,444

$0.25 / $2

400K

7483

qwen3.5-flash

Alibaba · Proprietary

1238+17/-17

1,563

N/A

7683

grok-4-1-fast-reasoning

xAI · Proprietary

1234+9/-9

6,911

$0.20 / $0.50

7686

mistral-large-3

Mistral · Apache 2.0

1223+20/-20

1,032

$0.50 / $1.50

N/A

7886

grok-4.1-thinking

xAI · Proprietary

1209+20/-20

1,209

N/A

8286

gemini-2.5-pro

Google · Proprietary

1204+13/-13

3,300

$1.25 / $10

8287

granite-4.1-8b

IBM · Apache 2.0

1201+18/-18

1,728

$0.05 / $0.10

131.1K

8287

devstral-2

Mistral · Modified MIT

1199+17/-17

1,585

N/A

8589

mercury-2

Inception AI · Proprietary

1165+23/-23

948

$0.25 / $0.75

128K

8789

grok-4-fast-reasoning

xAI · Proprietary

1150+23/-23

934

$0.20 / $0.50

8789

grok-code-fast-1

xAI · Proprietary

1140+22/-22

982

$0.20 / $1.50

N/A

9090

devstral-medium-2507

Mistral · Proprietary

1092+23/-23

992

$0.40 / $2

128K

Domain

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Domain

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles