Code Arena | WebDevReact

View overall rankings across AI models on front-end web development tasks: multi-step reasoning, tool use, and React code generation.

Jul 16, 2026

307,872 votes

83 models

Rank by

	Rank Spread
1	11	kimi-k3 Moonshot · Proprietary	1692+22/-22	1,223	$3 / $15	1M
2	23	claude-fable-5 Anthropic · Proprietary	1634+15/-15	1,904	$10 / $50	1M
3	23	gpt-5.6-sol-xhigh (codex-harness) OpenAI · Proprietary	1627+16/-16	1,721	$5 / $30	1.1M
4	44	glm-5.2 (max) Z.ai · MIT	1597+11/-11	3,436	$1.40 / $4.40	1M
5	510	claude-opus-4-8-thinking Anthropic · Proprietary	1558+10/-10	4,530	$5 / $25	1M
6	510	claude-opus-4-7-thinking Anthropic · Proprietary	1557+8/-8	8,748	$5 / $25	1M
7	513	grok-4.5 SpaceXAI · Proprietary	1552+16/-16	1,520	$2 / $6	500K
8	512	claude-opus-4-7 Anthropic · Proprietary	1551+8/-8	8,366	$5 / $25	1M
9	514	claude-sonnet-5-high Anthropic · Proprietary	1545+13/-13	2,360	$2 / $10	1M
10	815	claude-opus-4-6-thinking Anthropic · Proprietary	1537+7/-7	10,680	$5 / $25	1M
11	715	claude-opus-4-8 Anthropic · Proprietary	1535+9/-9	4,860	$5 / $25	1M
12	716	seed-2.1-pro-preview Bytedance · Proprietary	1534+11/-11	3,197	N/A	N/A
13	519	muse-spark-1.1 Meta · Proprietary	1533+17/-17	1,390	$1.25 / $4.25	N/A
14	915	claude-opus-4-6 Anthropic · Proprietary	1529+6/-6	11,760	$5 / $25	1M
15	1019	glm-5.1 Z.ai · MIT	1522+9/-9	4,815	$1.40 / $4.40	202.8K
16	1419	claude-sonnet-4-6 Anthropic · Proprietary	1516+6/-6	13,654	$3 / $15	1M
17	1320	qwen3.7-max-20260517 Alibaba · Proprietary	1513+9/-9	5,009	$1.48 / $4.42	1M
18	1420	kimi-k2.6 Moonshot · Modified MIT	1510+8/-8	6,755	$0.95 / $4	262.1K
19	1424	gemini-3.5-flash Google · Proprietary	1502+14/-14	1,925	$1.50 / $9	1M
20	1723	gpt-5.5-xhigh (codex-harness) OpenAI · Proprietary	1497+8/-8	7,620	$5 / $30	N/A
21	1926	minimax-m3 MiniMax · MiniMax Community License	1492+9/-9	5,051	$0.60 / $2.40	N/A
22	1926	gemini-3.5-flash-medium Google · Proprietary	1492+10/-10	4,120	$1.50 / $9	1M
23	2128	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary	1477+10/-10	5,092	$5 / $25	200K
24	2128	gpt-5.5-high (codex-harness) OpenAI · Proprietary	1476+8/-8	7,806	N/A	N/A
25	2030	qwen3.6-max-preview Alibaba · Proprietary	1475+13/-13	2,195	$1.04 / $6.24	262.1K
26	2332	kimi-k2.7-code Moonshot · Modified MIT	1469+10/-10	3,699	$1 / $4.40	262.1K
27	2332	mimo-v2.5-pro Xiaomi · MIT	1465+8/-8	7,924	$0.43 / $0.87	1M
28	2533	claude-opus-4-5-20251101 Anthropic · Proprietary	1459+8/-8	6,910	$5 / $25	200K
29	2633	qwen3.6-plus Alibaba · Proprietary	1455+7/-7	9,275	$0.33 / $1.95	1M
30	2634	deepseek-v4-pro-thinking DeepSeek · MIT	1451+8/-8	7,457	$0.43 / $0.87	1M
31	2541	gpt-5.4-high (codex-harness) OpenAI · Proprietary	1449+18/-18	1,322	$2.50 / $15	1.1M
32	2838	deepseek-v4-pro DeepSeek · MIT	1444+8/-8	6,632	$0.43 / $0.87	1M
33	1956	glm-4.7 Z.ai · MIT	1436+60/-60	119	$0.40 / $1.75	202.8K
34	3142	gpt-5.5 (codex-harness) OpenAI · Proprietary	1436+8/-8	7,637	N/A	N/A
35	3141	gemini-3.1-pro-preview Google · Proprietary	1434+6/-6	13,603	$2 / $12	1M
36	3142	gemini-3-flash Google · Proprietary	1431+11/-11	3,990	$0.50 / $3	1M
37	3043	inkling Thinky · Apache 2.0	1429+18/-18	1,145	$1 / $4.05	1M
38	3242	kimi-k2.5-thinking Moonshot · Modified MIT	1426+6/-6	12,670	$0.60 / $3	N/A
39	3145	gpt-5.4-medium (codex-harness) OpenAI · Proprietary	1426+17/-17	1,284	$2.50 / $15	1.1M
40	3242	mimo-v2.5 Xiaomi · MIT	1423+8/-8	7,153	$0.14 / $0.28	1M
41	3242	mimo-v2-pro Xiaomi · Proprietary	1423+8/-8	5,990	$1 / $3	1M
42	3443	glm-5 Z.ai · MIT	1420+8/-8	6,464	$1 / $3.20	202.8K
43	3952	gemini-3-pro Google · Proprietary	1402+11/-11	3,396	$2 / $12	1M
44	4155	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1396+13/-13	2,598	$1.75 / $14	400K
45	4254	kimi-k2.5-instant Moonshot · Modified MIT	1396+12/-12	3,021	$0.57 / $2.85	262.1K
46	4255	gpt-5.4-mini-high OpenAI · Proprietary	1389+7/-7	8,558	$0.75 / $4.50	400K
47	4255	minimax-m2.7 MiniMax · Modified MIT	1389+7/-7	8,964	$0.25 / $1	204.8K
48	4162	glm-5v-turbo Z.ai · Proprietary	1388+22/-22	786	$1.20 / $4	202.8K
49	4255	qwen3.5-397b-a17b Alibaba · Apache 2.0	1387+6/-6	12,368	$0.39 / $2.34	262.1K
50	4256	claude-sonnet-4-5-20250929 Anthropic · Proprietary	1386+9/-9	5,434	$3 / $15	200K
51	4258	claude-sonnet-4-5-20250929-thinking-32k Anthropic · Proprietary	1381+10/-10	4,426	$3 / $15	200K
52	4264	gpt-5.4 OpenAI · Proprietary	1379+22/-22	758	$2.50 / $15	1.1M
53	4357	gemini-3-flash (thinking-minimal) Google · Proprietary	1378+6/-6	13,919	$0.50 / $3	1M
54	4461	grok-4.20-beta-0309-reasoning SpaceXAI · Proprietary	1377+7/-7	10,227	$2 / $6	2M
55	4363	minimax-m2.1-preview MiniMax · MIT	1373+13/-13	2,492	$0.30 / $1.20	204.8K
56	4862	minimax-m2.5 MiniMax · Modified MIT	1372+8/-8	6,793	$0.15 / $0.90	204.8K
57	5266	gemma-4-31b Google · Apache 2.0	1362+9/-9	5,541	$0.14 / $0.40	262.1K
58	5166	deepseek-v3.2-thinking DeepSeek · MIT	1361+10/-10	3,906	$0.27 / $0.40	163.8K
59	5266	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1359+11/-11	3,154	$1.75 / $14	400K
60	5366	qwen3.5-122b-a10b Alibaba · Apache 2.0	1359+8/-8	7,145	$0.26 / $2.08	262.1K
61	5066	hunyuan-hy3-preview Tencent · tencent-hunyuan-community	1357+18/-18	1,163	N/A	N/A
62	5566	grok-4.3 SpaceXAI · Proprietary	1355+8/-8	6,957	$1.25 / $2.50	1M
63	5266	gemma-4-26b-a4b Google · Apache 2.0	1354+17/-17	1,302	N/A	N/A
64	5766	deepseek-v3.2 DeepSeek · MIT	1347+9/-9	5,211	$0.27 / $0.40	163.8K
65	5766	qwen3.5-27b Alibaba · Apache 2.0	1346+8/-8	6,717	$0.20 / $1.56	262.1K
66	5667	laguna-m.1 Poolside · Apache 2.0	1345+12/-12	3,141	$0.20 / $0.40	262.1K
67	6770	claude-haiku-4-5-20251001 Anthropic · Proprietary	1327+6/-6	12,447	$1 / $5	200K
68	6671	gpt-5.2-codex OpenAI · Proprietary	1327+9/-9	4,628	$1.75 / $14	400K
69	6771	kimi-k2-thinking-turbo Moonshot · Modified MIT	1318+9/-9	5,372	$1.15 / $8	262.1K
70	6772	mimo-v2-flash (non-thinking) Xiaomi · MIT	1311+12/-12	2,613	$0.10 / $0.30	262.1K
71	6872	gpt-5.1 OpenAI · Proprietary	1306+12/-12	2,861	$1.25 / $10	400K
72	7072	laguna-xs.2 Poolside · Apache 2.0	1296+12/-12	3,233	$0.10 / $0.20	262.1K
73	7375	qwen3-coder-480b-a35b-instruct Alibaba · Apache 2.0	1265+10/-10	4,444	$0.40 / $1.60	262.1K
74	7378	mistral-medium-3.5 Mistral · Modified MIT	1260+16/-16	1,847	$1.50 / $7.50	262.1K
75	7480	gemini-3.1-flash-lite-preview Google · Proprietary	1243+7/-7	11,706	$0.25 / $1.50	1M
76	7380	mimo-v2-flash (thinking) Xiaomi · MIT	1237+21/-21	913	$0.10 / $0.30	262.1K
77	7480	trinity-large-thinking Apache 2.0	1233+21/-21	1,113	$0.25 / $0.80	262.1K
78	7480	qwen3.5-35b-a3b Alibaba · Apache 2.0	1232+17/-17	1,564	$0.14 / $1	262.1K
79	7581	grok-4-1-fast-reasoning SpaceXAI · Proprietary	1225+18/-18	1,455	$0.20 / $0.50	2M
80	7582	qwen3.5-flash Alibaba · Proprietary	1218+18/-18	1,367	N/A	N/A
81	7983	granite-4.1-8b IBM · Apache 2.0	1190+19/-19	1,498	$0.05 / $0.10	131.1K
82	8083	devstral-2 Mistral · Modified MIT	1164+43/-43	225	N/A	N/A
83	8183	mercury-2 Inception AI · Proprietary	1153+24/-24	846	$0.25 / $0.75	128K

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Rank Spread

kimi-k3

Moonshot · Proprietary

1692+22/-22

1,223

$3 / $15

claude-fable-5

Anthropic · Proprietary

1634+15/-15

1,904

$10 / $50

gpt-5.6-sol-xhigh (codex-harness)

OpenAI · Proprietary

1627+16/-16

1,721

$5 / $30

1.1M

glm-5.2 (max)

Z.ai · MIT

1597+11/-11

3,436

$1.40 / $4.40

510

claude-opus-4-8-thinking

Anthropic · Proprietary

1558+10/-10

4,530

$5 / $25

510

claude-opus-4-7-thinking

Anthropic · Proprietary

1557+8/-8

8,748

$5 / $25

513

grok-4.5

SpaceXAI · Proprietary

1552+16/-16

1,520

$2 / $6

500K

512

claude-opus-4-7

Anthropic · Proprietary

1551+8/-8

8,366

$5 / $25

514

claude-sonnet-5-high

Anthropic · Proprietary

1545+13/-13

2,360

$2 / $10

815

claude-opus-4-6-thinking

Anthropic · Proprietary

1537+7/-7

10,680

$5 / $25

715

claude-opus-4-8

Anthropic · Proprietary

1535+9/-9

4,860

$5 / $25

716

seed-2.1-pro-preview

Bytedance · Proprietary

1534+11/-11

3,197

N/A

519

muse-spark-1.1

Meta · Proprietary

1533+17/-17

1,390

$1.25 / $4.25

N/A

915

claude-opus-4-6

Anthropic · Proprietary

1529+6/-6

11,760

$5 / $25

1019

glm-5.1

Z.ai · MIT

1522+9/-9

4,815

$1.40 / $4.40

202.8K

1419

claude-sonnet-4-6

Anthropic · Proprietary

1516+6/-6

13,654

$3 / $15

1320

qwen3.7-max-20260517

Alibaba · Proprietary

1513+9/-9

5,009

$1.48 / $4.42

1420

kimi-k2.6

Moonshot · Modified MIT

1510+8/-8

6,755

$0.95 / $4

262.1K

1424

gemini-3.5-flash

Google · Proprietary

1502+14/-14

1,925

$1.50 / $9

1723

gpt-5.5-xhigh (codex-harness)

OpenAI · Proprietary

1497+8/-8

7,620

$5 / $30

N/A

1926

minimax-m3

MiniMax · MiniMax Community License

1492+9/-9

5,051

$0.60 / $2.40

N/A

1926

gemini-3.5-flash-medium

Google · Proprietary

1492+10/-10

4,120

$1.50 / $9

2128

claude-opus-4-5-20251101-thinking-32k

Anthropic · Proprietary

1477+10/-10

5,092

$5 / $25

200K

2128

gpt-5.5-high (codex-harness)

OpenAI · Proprietary

1476+8/-8

7,806

N/A

2030

qwen3.6-max-preview

Alibaba · Proprietary

1475+13/-13

2,195

$1.04 / $6.24

262.1K

2332

kimi-k2.7-code

Moonshot · Modified MIT

1469+10/-10

3,699

$1 / $4.40

262.1K

2332

mimo-v2.5-pro

Xiaomi · MIT

1465+8/-8

7,924

$0.43 / $0.87

2533

claude-opus-4-5-20251101

Anthropic · Proprietary

1459+8/-8

6,910

$5 / $25

200K

2633

qwen3.6-plus

Alibaba · Proprietary

1455+7/-7

9,275

$0.33 / $1.95

2634

deepseek-v4-pro-thinking

DeepSeek · MIT

1451+8/-8

7,457

$0.43 / $0.87

2541

gpt-5.4-high (codex-harness)

OpenAI · Proprietary

1449+18/-18

1,322

$2.50 / $15

1.1M

2838

deepseek-v4-pro

DeepSeek · MIT

1444+8/-8

6,632

$0.43 / $0.87

1956

glm-4.7

Z.ai · MIT

1436+60/-60

119

$0.40 / $1.75

202.8K

3142

gpt-5.5 (codex-harness)

OpenAI · Proprietary

1436+8/-8

7,637

N/A

3141

gemini-3.1-pro-preview

Google · Proprietary

1434+6/-6

13,603

$2 / $12

3142

gemini-3-flash

Google · Proprietary

1431+11/-11

3,990

$0.50 / $3

3043

inkling

Thinky · Apache 2.0

1429+18/-18

1,145

$1 / $4.05

3242

kimi-k2.5-thinking

Moonshot · Modified MIT

1426+6/-6

12,670

$0.60 / $3

N/A

3145

gpt-5.4-medium (codex-harness)

OpenAI · Proprietary

1426+17/-17

1,284

$2.50 / $15

1.1M

3242

mimo-v2.5

Xiaomi · MIT

1423+8/-8

7,153

$0.14 / $0.28

3242

mimo-v2-pro

Xiaomi · Proprietary

1423+8/-8

5,990

$1 / $3

3443

glm-5

Z.ai · MIT

1420+8/-8

6,464

$1 / $3.20

202.8K

3952

gemini-3-pro

Google · Proprietary

1402+11/-11

3,396

$2 / $12

4155

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1396+13/-13

2,598

$1.75 / $14

400K

4254

kimi-k2.5-instant

Moonshot · Modified MIT

1396+12/-12

3,021

$0.57 / $2.85

262.1K

4255

gpt-5.4-mini-high

OpenAI · Proprietary

1389+7/-7

8,558

$0.75 / $4.50

400K

4255

minimax-m2.7

MiniMax · Modified MIT

1389+7/-7

8,964

$0.25 / $1

204.8K

4162

glm-5v-turbo

Z.ai · Proprietary

1388+22/-22

786

$1.20 / $4

202.8K

4255

qwen3.5-397b-a17b

Alibaba · Apache 2.0

1387+6/-6

12,368

$0.39 / $2.34

262.1K

4256

claude-sonnet-4-5-20250929

Anthropic · Proprietary

1386+9/-9

5,434

$3 / $15

200K

4258

claude-sonnet-4-5-20250929-thinking-32k

Anthropic · Proprietary

1381+10/-10

4,426

$3 / $15

200K

4264

gpt-5.4

OpenAI · Proprietary

1379+22/-22

758

$2.50 / $15

1.1M

4357

gemini-3-flash (thinking-minimal)

Google · Proprietary

1378+6/-6

13,919

$0.50 / $3

4461

grok-4.20-beta-0309-reasoning

SpaceXAI · Proprietary

1377+7/-7

10,227

$2 / $6

4363

minimax-m2.1-preview

MiniMax · MIT

1373+13/-13

2,492

$0.30 / $1.20

204.8K

4862

minimax-m2.5

MiniMax · Modified MIT

1372+8/-8

6,793

$0.15 / $0.90

204.8K

5266

gemma-4-31b

Google · Apache 2.0

1362+9/-9

5,541

$0.14 / $0.40

262.1K

5166

deepseek-v3.2-thinking

DeepSeek · MIT

1361+10/-10

3,906

$0.27 / $0.40

163.8K

5266

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1359+11/-11

3,154

$1.75 / $14

400K

5366

qwen3.5-122b-a10b

Alibaba · Apache 2.0

1359+8/-8

7,145

$0.26 / $2.08

262.1K

5066

hunyuan-hy3-preview

Tencent · tencent-hunyuan-community

1357+18/-18

1,163

N/A

5566

grok-4.3

SpaceXAI · Proprietary

1355+8/-8

6,957

$1.25 / $2.50

5266

gemma-4-26b-a4b

Google · Apache 2.0

1354+17/-17

1,302

N/A

5766

deepseek-v3.2

DeepSeek · MIT

1347+9/-9

5,211

$0.27 / $0.40

163.8K

5766

qwen3.5-27b

Alibaba · Apache 2.0

1346+8/-8

6,717

$0.20 / $1.56

262.1K

5667

laguna-m.1

Poolside · Apache 2.0

1345+12/-12

3,141

$0.20 / $0.40

262.1K

6770

claude-haiku-4-5-20251001

Anthropic · Proprietary

1327+6/-6

12,447

$1 / $5

200K

6671

gpt-5.2-codex

OpenAI · Proprietary

1327+9/-9

4,628

$1.75 / $14

400K

6771

kimi-k2-thinking-turbo

Moonshot · Modified MIT

1318+9/-9

5,372

$1.15 / $8

262.1K

6772

mimo-v2-flash (non-thinking)

Xiaomi · MIT

1311+12/-12

2,613

$0.10 / $0.30

262.1K

6872

gpt-5.1

OpenAI · Proprietary

1306+12/-12

2,861

$1.25 / $10

400K

7072

laguna-xs.2

Poolside · Apache 2.0

1296+12/-12

3,233

$0.10 / $0.20

262.1K

7375

qwen3-coder-480b-a35b-instruct

Alibaba · Apache 2.0

1265+10/-10

4,444

$0.40 / $1.60

262.1K

7378

mistral-medium-3.5

Mistral · Modified MIT

1260+16/-16

1,847

$1.50 / $7.50

262.1K

7480

gemini-3.1-flash-lite-preview

Google · Proprietary

1243+7/-7

11,706

$0.25 / $1.50

7380

mimo-v2-flash (thinking)

Xiaomi · MIT

1237+21/-21

913

$0.10 / $0.30

262.1K

7480

trinity-large-thinking

Apache 2.0

1233+21/-21

1,113

$0.25 / $0.80

262.1K

7480

qwen3.5-35b-a3b

Alibaba · Apache 2.0

1232+17/-17

1,564

$0.14 / $1

262.1K

7581

grok-4-1-fast-reasoning

SpaceXAI · Proprietary

1225+18/-18

1,455

$0.20 / $0.50

7582

qwen3.5-flash

Alibaba · Proprietary

1218+18/-18

1,367

N/A

7983

granite-4.1-8b

IBM · Apache 2.0

1190+19/-19

1,498

$0.05 / $0.10

131.1K

8083

devstral-2

Mistral · Modified MIT

1164+43/-43

225

N/A

8183

mercury-2

Inception AI · Proprietary

1153+24/-24

846

$0.25 / $0.75

128K

Domain

Code Arena | WebDevReact

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Domain

Code Arena | WebDevReact

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Fraction of Model A Wins for All Non-tied A vs. B Battles