Code Arena | WebDevReact

View overall rankings across AI models on front-end web development tasks: multi-step reasoning, tool use, and React code generation.

Jul 19, 2026

320,317 votes

84 models

Rank by

	Rank Spread
1	11	kimi-k3 Moonshot · Proprietary	1693+21/-21	1,263	N/A	N/A
2	23	gpt-5.6-sol-xhigh (codex-harness) OpenAI · Proprietary	1643+14/-14	2,480	N/A	N/A
3	23	claude-fable-5 Anthropic · Proprietary	1640+14/-14	2,219	N/A	N/A
4	44	glm-5.2 (max) Z.ai · MIT	1603+11/-11	3,814	N/A	N/A
5	59	claude-opus-4-8-thinking Anthropic · Proprietary	1561+9/-9	4,884	N/A	N/A
6	510	claude-opus-4-7-thinking Anthropic · Proprietary	1558+7/-7	9,083	N/A	N/A
7	512	claude-opus-4-7 Anthropic · Proprietary	1553+7/-7	8,706	N/A	N/A
8	514	grok-4.5 SpaceXAI · Proprietary	1553+14/-14	1,888	N/A	N/A
9	514	claude-sonnet-5-high Anthropic · Proprietary	1549+12/-12	2,681	N/A	N/A
10	815	claude-opus-4-6-thinking Anthropic · Proprietary	1537+7/-7	11,009	N/A	N/A
11	716	claude-opus-4-8 Anthropic · Proprietary	1537+9/-9	5,192	N/A	N/A
12	618	muse-spark-1.1 Meta · Proprietary	1535+15/-15	1,723	N/A	N/A
13	719	gemini-3.6-flash Google · Proprietary	1532+15/-15	1,820	N/A	N/A
14	818	seed-2.1-pro-preview Bytedance · Proprietary	1531+11/-11	3,517	N/A	N/A
15	1016	claude-opus-4-6 Anthropic · Proprietary	1529+6/-6	12,076	N/A	N/A
16	1120	glm-5.1 Z.ai · MIT	1520+9/-9	5,142	N/A	N/A
17	1320	claude-sonnet-4-6 Anthropic · Proprietary	1516+6/-6	13,980	N/A	N/A
18	1321	qwen3.7-max-20260517 Alibaba · Proprietary	1513+9/-9	5,304	N/A	N/A
19	1521	kimi-k2.6 Moonshot · Modified MIT	1511+8/-8	6,806	N/A	N/A
20	1625	gemini-3.5-flash Google · Proprietary	1502+14/-14	1,923	N/A	N/A
21	1824	gpt-5.5-xhigh (codex-harness) OpenAI · Proprietary	1499+8/-8	7,905	N/A	N/A
22	2027	minimax-m3 MiniMax · MiniMax Community License	1490+9/-9	5,457	N/A	N/A
23	2027	gemini-3.5-flash-medium Google · Proprietary	1488+10/-10	4,435	N/A	N/A
24	2229	gpt-5.5-high (codex-harness) OpenAI · Proprietary	1477+8/-8	8,126	N/A	N/A
25	2229	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary	1476+10/-10	5,098	N/A	N/A
26	2131	qwen3.6-max-preview Alibaba · Proprietary	1475+13/-13	2,190	N/A	N/A
27	2433	kimi-k2.7-code Moonshot · Modified MIT	1468+10/-10	3,772	N/A	N/A
28	2433	mimo-v2.5-pro Xiaomi · MIT	1465+8/-8	8,227	N/A	N/A
29	2633	claude-opus-4-5-20251101 Anthropic · Proprietary	1458+8/-8	6,906	N/A	N/A
30	2734	qwen3.6-plus Alibaba · Proprietary	1454+7/-7	9,583	N/A	N/A
31	2736	deepseek-v4-pro-thinking DeepSeek · MIT	1451+8/-8	7,792	N/A	N/A
32	2641	gpt-5.4-high (codex-harness) OpenAI · Proprietary	1448+18/-18	1,322	N/A	N/A
33	3038	deepseek-v4-pro DeepSeek · MIT	1441+8/-8	6,959	N/A	N/A
34	3142	gpt-5.5 (codex-harness) OpenAI · Proprietary	1437+8/-8	7,923	N/A	N/A
35	2057	glm-4.7 Z.ai · MIT	1436+60/-60	119	N/A	N/A
36	3242	gemini-3.1-pro-preview Google · Proprietary	1434+6/-6	13,980	N/A	N/A
37	3243	gemini-3-flash Google · Proprietary	1431+11/-11	3,995	N/A	N/A
38	3343	kimi-k2.5-thinking Moonshot · Modified MIT	1427+6/-6	12,989	N/A	N/A
39	3146	gpt-5.4-medium (codex-harness) OpenAI · Proprietary	1426+17/-17	1,284	N/A	N/A
40	3343	mimo-v2-pro Xiaomi · Proprietary	1423+8/-8	5,967	N/A	N/A
41	3443	mimo-v2.5 Xiaomi · MIT	1421+8/-8	7,483	N/A	N/A
42	3644	glm-5 Z.ai · MIT	1420+8/-8	6,463	N/A	N/A
43	3347	inkling Thinky · Apache 2.0	1420+14/-14	2,043	N/A	N/A
44	4053	gemini-3-pro Google · Proprietary	1402+11/-11	3,398	N/A	N/A
45	4155	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1396+13/-13	2,599	N/A	N/A
46	4255	kimi-k2.5-instant Moonshot · Modified MIT	1395+12/-12	3,024	N/A	N/A
47	4158	glm-5v-turbo Z.ai · Proprietary	1391+19/-19	1,102	N/A	N/A
48	4355	minimax-m2.7 MiniMax · Modified MIT	1390+7/-7	9,263	N/A	N/A
49	4356	gpt-5.4-mini-high OpenAI · Proprietary	1388+7/-7	8,808	N/A	N/A
50	4356	qwen3.5-397b-a17b Alibaba · Apache 2.0	1386+6/-6	12,666	N/A	N/A
51	4357	claude-sonnet-4-5-20250929 Anthropic · Proprietary	1386+9/-9	5,414	N/A	N/A
52	4359	claude-sonnet-4-5-20250929-thinking-32k Anthropic · Proprietary	1381+10/-10	4,427	N/A	N/A
53	4458	gemini-3-flash (thinking-minimal) Google · Proprietary	1379+6/-6	14,258	N/A	N/A
54	4364	gpt-5.4 OpenAI · Proprietary	1378+22/-22	801	N/A	N/A
55	4762	grok-4.20-beta-0309-reasoning SpaceXAI · Proprietary	1375+7/-7	10,555	N/A	N/A
56	4464	minimax-m2.1-preview MiniMax · MIT	1372+13/-13	2,493	N/A	N/A
57	4964	minimax-m2.5 MiniMax · Modified MIT	1371+8/-8	6,791	N/A	N/A
58	5367	deepseek-v3.2-thinking DeepSeek · MIT	1361+10/-10	3,900	N/A	N/A
59	5467	gemma-4-31b Google · Apache 2.0	1361+9/-9	5,792	N/A	N/A
60	5467	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1359+11/-11	3,142	N/A	N/A
61	5567	qwen3.5-122b-a10b Alibaba · Apache 2.0	1358+8/-8	7,127	N/A	N/A
62	5167	hunyuan-hy3-preview Tencent · tencent-hunyuan-community	1357+18/-18	1,161	N/A	N/A
63	5567	grok-4.3 SpaceXAI · Proprietary	1356+8/-8	7,297	N/A	N/A
64	5467	gemma-4-26b-a4b Google · Apache 2.0	1354+17/-17	1,301	N/A	N/A
65	5867	deepseek-v3.2 DeepSeek · MIT	1346+9/-9	5,202	N/A	N/A
66	5867	qwen3.5-27b Alibaba · Apache 2.0	1346+8/-8	6,703	N/A	N/A
67	5868	laguna-m.1 Poolside · Apache 2.0	1345+11/-11	3,480	N/A	N/A
68	6871	claude-haiku-4-5-20251001 Anthropic · Proprietary	1327+6/-6	12,731	N/A	N/A
69	6772	gpt-5.2-codex OpenAI · Proprietary	1327+9/-9	4,631	N/A	N/A
70	6872	kimi-k2-thinking-turbo Moonshot · Modified MIT	1317+9/-9	5,355	N/A	N/A
71	6873	mimo-v2-flash (non-thinking) Xiaomi · MIT	1311+12/-12	2,617	N/A	N/A
72	6973	gpt-5.1 OpenAI · Proprietary	1305+12/-12	2,864	N/A	N/A
73	7173	laguna-xs.2 Poolside · Apache 2.0	1296+12/-12	3,233	N/A	N/A
74	7476	qwen3-coder-480b-a35b-instruct Alibaba · Apache 2.0	1265+10/-10	4,444	N/A	N/A
75	7479	mistral-medium-3.5 Mistral · Modified MIT	1260+16/-16	1,845	N/A	N/A
76	7581	gemini-3.1-flash-lite-preview Google · Proprietary	1243+7/-7	11,677	N/A	N/A
77	7481	mimo-v2-flash (thinking) Xiaomi · MIT	1236+21/-21	915	N/A	N/A
78	7581	trinity-large-thinking Apache 2.0	1232+21/-21	1,113	N/A	N/A
79	7581	qwen3.5-35b-a3b Alibaba · Apache 2.0	1232+17/-17	1,564	N/A	N/A
80	7682	grok-4-1-fast-reasoning SpaceXAI · Proprietary	1225+18/-18	1,455	N/A	N/A
81	7683	qwen3.5-flash Alibaba · Proprietary	1218+18/-18	1,367	N/A	N/A
82	8084	granite-4.1-8b IBM · Apache 2.0	1190+19/-19	1,493	N/A	N/A
83	8184	devstral-2 Mistral · Modified MIT	1164+43/-43	225	N/A	N/A
84	8284	mercury-2 Inception AI · Proprietary	1153+24/-24	846	N/A	N/A

Code Arena | WebDevReact

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Domain

Code Arena | WebDevReact

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)