WebDev AI Leaderboard - Best AI Models for Web Development

	Rank Spread
1	11	kimi-k3 Moonshot · Proprietary	1677+17/-17	1,824	$3 / $15	1M
2	23	claude-fable-5 Anthropic · Proprietary	1636+12/-12	2,921	$10 / $50	1M
3	23	gpt-5.6-sol-xhigh (codex-harness) OpenAI · Proprietary	1633+11/-11	3,615	$5 / $30	1.1M
4	44	glm-5.2 (max) Z.ai · MIT	1593+10/-10	5,219	$1.40 / $4.40	1M
5	59	claude-opus-4-8-thinking Anthropic · Proprietary	1564+8/-8	7,818	$5 / $25	1M
6	510	claude-opus-4-7-thinking Anthropic · Proprietary	1559+7/-7	11,000	$5 / $25	1M
7	512	grok-4.5 SpaceXAI · Proprietary	1556+12/-12	2,715	$2 / $6	500K
8	512	claude-opus-4-7 Anthropic · Proprietary	1555+7/-7	10,446	$5 / $25	1M
9	515	claude-sonnet-5-high Anthropic · Proprietary	1546+11/-11	3,409	$2 / $10	1M
10	715	claude-opus-4-6-thinking Anthropic · Proprietary	1543+6/-6	13,377	$5 / $25	1M
11	617	muse-spark-1.1 Meta · Proprietary	1540+12/-12	2,569	$1.25 / $4.25	N/A
12	717	gemini-3.6-flash Google · Proprietary	1537+13/-13	2,278	$1.50 / $7.50	N/A
13	916	claude-opus-4-6 Anthropic · Proprietary	1536+6/-6	14,567	$5 / $25	1M
14	917	claude-opus-4-8 Anthropic · Proprietary	1534+8/-8	6,479	$5 / $25	1M
15	919	seed-2.1-pro-preview Bytedance · Proprietary	1531+10/-10	4,360	N/A	N/A
16	1120	glm-5.1 Z.ai · MIT	1525+8/-8	6,332	$1.40 / $4.40	202.8K
17	1220	claude-sonnet-4-6 Anthropic · Proprietary	1522+6/-6	16,761	$3 / $15	1M
18	1521	qwen3.7-max-20260517 Alibaba · Proprietary	1516+8/-8	6,915	$1.48 / $4.42	1M
19	1521	kimi-k2.6 Moonshot · Modified MIT	1515+7/-7	9,390	$0.95 / $4	262.1K
20	1822	gpt-5.5-xhigh (codex-harness) OpenAI · Proprietary	1506+7/-7	9,579	$5 / $30	N/A
21	1625	gemini-3.5-flash Google · Proprietary	1504+13/-13	2,290	$1.50 / $9	1M
22	2026	minimax-m3 MiniMax · MiniMax Community License	1492+8/-8	6,865	$0.60 / $2.40	N/A
23	2126	claude-opus-4-5-20251101-thinking-32k Anthropic · Proprietary	1490+7/-7	13,063	$5 / $25	200K
24	2127	gemini-3.5-flash-medium Google · Proprietary	1488+9/-9	6,137	$1.50 / $9	1M
25	2228	gpt-5.5-high (codex-harness) OpenAI · Proprietary	1483+7/-7	11,543	N/A	N/A
26	2130	qwen3.6-max-preview Alibaba · Proprietary	1480+12/-12	2,545	$1.04 / $6.24	262.1K
27	2430	mimo-v2.5-pro Xiaomi · MIT	1474+7/-7	9,963	$0.43 / $0.87	1M
28	2532	kimi-k2.7-code Moonshot · Modified MIT	1470+9/-9	4,677	$0.82 / $3.75	262.1K
29	2632	claude-opus-4-5-20251101 Anthropic · Proprietary	1466+6/-6	15,320	$5 / $25	200K
30	2835	qwen3.6-plus Alibaba · Proprietary	1459+6/-6	12,411	$0.33 / $1.95	1M
31	2835	deepseek-v4-pro-thinking DeepSeek · MIT	1459+7/-7	9,430	$0.43 / $0.87	1M
32	2639	gpt-5.4-high (codex-harness) OpenAI · Proprietary	1457+17/-17	1,482	$2.50 / $15	1.1M
33	3039	gpt-5.5 (codex-harness) OpenAI · Proprietary	1450+7/-7	9,692	N/A	N/A
34	3039	deepseek-v4-pro DeepSeek · MIT	1446+7/-7	10,172	$0.43 / $0.87	1M
35	3241	gemini-3.1-pro-preview Google · Proprietary	1444+5/-5	17,979	$2 / $12	1M
36	3244	glm-4.7 Z.ai · MIT	1440+10/-10	4,884	$0.40 / $1.75	202.8K
37	3244	gemini-3-pro Google · Proprietary	1439+7/-7	17,159	$2 / $12	1M
38	3244	gemini-3-flash Google · Proprietary	1437+8/-8	13,283	$0.50 / $3	1M
39	3045	gpt-5.4-medium (codex-harness) OpenAI · Proprietary	1437+16/-16	1,449	$2.50 / $15	1.1M
40	3544	kimi-k2.5-thinking Moonshot · Modified MIT	1433+6/-6	15,634	$0.60 / $3	N/A
41	3544	mimo-v2-pro Xiaomi · Proprietary	1431+8/-8	6,870	$1 / $3	1M
42	3644	glm-5 Z.ai · MIT	1430+8/-8	7,451	$1 / $3.20	202.8K
43	3645	mimo-v2.5 Xiaomi · MIT	1427+7/-7	9,085	$0.14 / $0.28	1M
44	3648	inkling Thinky · Apache 2.0	1426+12/-12	2,791	$1 / $4.05	1M
45	4455	kimi-k2.5-instant Moonshot · Modified MIT	1408+11/-11	3,615	$0.57 / $2.85	262.1K
46	4457	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1406+12/-12	2,965	$1.75 / $14	400K
47	4260	gpt-5.2 OpenAI · Proprietary	1406+17/-17	1,455	$1.75 / $14	400K
48	4460	glm-5v-turbo Z.ai · Proprietary	1403+16/-16	1,497	$1.20 / $4	202.8K
49	4559	gpt-5.4-mini-high OpenAI · Proprietary	1398+7/-7	10,587	$0.75 / $4.50	400K
50	4559	minimax-m2.7 MiniMax · Modified MIT	1396+6/-6	11,028	$0.25 / $1	204.8K
51	4559	qwen3.5-397b-a17b Alibaba · Apache 2.0	1396+6/-6	15,122	$0.39 / $2.34	262.1K
52	4562	gpt-5-medium OpenAI · Proprietary	1394+13/-13	3,756	$1.25 / $10	400K
53	4561	minimax-m2.1-preview MiniMax · MIT	1392+8/-8	9,272	$0.30 / $1.20	204.8K
54	4562	gpt-5.1-medium OpenAI · Proprietary	1391+10/-10	6,121	$1.25 / $10	400K
55	4662	claude-sonnet-4-5-20250929-thinking-32k Anthropic · Proprietary	1388+7/-7	15,747	$3 / $15	200K
56	4761	gemini-3-flash (thinking-minimal) Google · Proprietary	1388+5/-5	21,989	$0.50 / $3	1M
57	4762	claude-sonnet-4-5-20250929 Anthropic · Proprietary	1386+6/-6	18,400	$3 / $15	200K
58	4663	claude-opus-4-1-20250805 Anthropic · Proprietary	1386+9/-9	8,568	$15 / $75	200K
59	4568	gpt-5.4 OpenAI · Proprietary	1385+19/-19	988	$2.50 / $15	1.1M
60	5066	minimax-m2.5 MiniMax · Modified MIT	1381+8/-8	7,861	$0.15 / $0.90	204.8K
61	5265	grok-4.20-beta-0309-reasoning SpaceXAI · Proprietary	1381+6/-6	13,628	$2 / $6	2M
62	5471	gpt-5.3-codex (codex-harness) OpenAI · Proprietary	1371+11/-11	3,566	$1.75 / $14	400K
63	5971	deepseek-v3.2-thinking DeepSeek · MIT	1368+8/-8	7,920	$0.27 / $0.40	163.8K
64	6071	gemma-4-31b Google · Apache 2.0	1367+8/-8	6,808	$0.14 / $0.40	262.1K
65	6171	qwen3.5-122b-a10b Alibaba · Apache 2.0	1364+7/-7	8,214	$0.26 / $2.08	262.1K
66	5873	hunyuan-hy3-preview Tencent · tencent-hunyuan-community	1362+17/-17	1,378	N/A	N/A
67	6171	grok-4.3 SpaceXAI · Proprietary	1361+7/-7	8,901	$1.25 / $2.50	1M
68	5973	gemma-4-26b-a4b Google · Apache 2.0	1360+16/-16	1,513	N/A	N/A
69	6271	qwen3.5-27b Alibaba · Apache 2.0	1356+8/-8	7,720	$0.26 / $2.60	262.1K
70	6272	glm-4.6 Z.ai · MIT	1355+9/-9	8,348	$0.50 / $2	202.8K
71	6273	laguna-m.1 Poolside · Apache 2.0	1353+10/-10	4,416	$0.20 / $0.40	262.1K
72	6877	gpt-5.1 OpenAI · Proprietary	1339+7/-7	12,870	$1.25 / $10	400K
73	6978	mimo-v2-flash (non-thinking) Xiaomi · MIT	1337+8/-8	6,736	$0.10 / $0.30	262.1K
74	7278	gpt-5.2-codex OpenAI · Proprietary	1334+8/-8	7,776	$1.75 / $14	400K
75	7278	deepseek-v3.2 DeepSeek · MIT	1332+7/-7	10,493	$0.27 / $0.40	163.8K
76	7278	gpt-5.1-codex OpenAI · Proprietary	1330+10/-10	6,217	$1.25 / $10	400K
77	7278	kimi-k2-thinking-turbo Moonshot · Modified MIT	1329+6/-6	15,348	$1.15 / $8	262.1K
78	7378	claude-haiku-4-5-20251001 Anthropic · Proprietary	1327+5/-5	26,368	$1 / $5	200K
79	7982	minimax-m2 MiniMax · Apache 2.0	1304+9/-9	8,397	$0.30 / $1.20	204.8K
80	7982	laguna-xs.2 Poolside · Apache 2.0	1303+11/-11	3,881	$0.10 / $0.20	262.1K
81	7983	mimo-v2-flash (thinking) Xiaomi · MIT	1300+14/-14	2,101	$0.10 / $0.30	262.1K
82	7984	deepseek-v3.2-exp DeepSeek · MIT	1288+11/-11	4,869	$0.27 / $0.41	163.8K
83	8184	qwen3-coder-480b-a35b-instruct Alibaba · Apache 2.0	1281+7/-7	15,216	$0.40 / $1.60	262.1K
84	8290	mistral-medium-3.5 Mistral · Modified MIT	1267+15/-15	2,166	$1.50 / $7.50	262.1K
85	8492	KAT-Coder-Pro-V1 Proprietary	1259+16/-16	1,879	$0.21 / $0.83	256K
86	8490	gemini-3.1-flash-lite-preview Google · Proprietary	1253+7/-7	13,573	$0.25 / $1.50	1M
87	8492	qwen3.5-35b-a3b Alibaba · Apache 2.0	1250+16/-16	1,815	$0.14 / $1	262.1K
88	8493	trinity-large-thinking Apache 2.0	1243+19/-19	1,321	$0.25 / $0.80	262.1K
89	8493	gpt-5.1-codex-mini OpenAI · Proprietary	1240+18/-18	1,445	$0.25 / $2	400K
90	8493	qwen3.5-flash Alibaba · Proprietary	1237+17/-17	1,561	N/A	N/A
91	8693	grok-4-1-fast-reasoning SpaceXAI · Proprietary	1234+9/-9	6,907	$0.20 / $0.50	2M
92	8696	mistral-large-3 Mistral · Apache 2.0	1223+20/-20	1,034	$0.50 / $1.50	N/A
93	8896	grok-4.1-thinking SpaceXAI · Proprietary	1209+20/-20	1,209	N/A	N/A
94	9296	gemini-2.5-pro Google · Proprietary	1204+13/-13	3,299	$1.25 / $10	1M
95	9297	devstral-2 Mistral · Modified MIT	1200+17/-17	1,588	N/A	N/A
96	9297	granite-4.1-8b IBM · Apache 2.0	1200+17/-17	1,759	$0.05 / $0.10	131.1K
97	9599	mercury-2 Inception AI · Proprietary	1164+23/-23	947	$0.25 / $0.75	128K
98	9799	grok-4-fast-reasoning SpaceXAI · Proprietary	1151+23/-23	935	$0.20 / $0.50	2M
99	9799	grok-code-fast-1 SpaceXAI · Proprietary	1140+22/-22	981	$0.20 / $1.50	N/A
100	100100	devstral-medium-2507 Mistral · Proprietary	1093+23/-23	993	$0.40 / $2	128K

Rank Spread

kimi-k3

Moonshot · Proprietary

1677+17/-17

1,824

$3 / $15

claude-fable-5

Anthropic · Proprietary

1636+12/-12

2,921

$10 / $50

gpt-5.6-sol-xhigh (codex-harness)

OpenAI · Proprietary

1633+11/-11

3,615

$5 / $30

1.1M

glm-5.2 (max)

Z.ai · MIT

1593+10/-10

5,219

$1.40 / $4.40

claude-opus-4-8-thinking

Anthropic · Proprietary

1564+8/-8

7,818

$5 / $25

510

claude-opus-4-7-thinking

Anthropic · Proprietary

1559+7/-7

11,000

$5 / $25

512

grok-4.5

SpaceXAI · Proprietary

1556+12/-12

2,715

$2 / $6

500K

512

claude-opus-4-7

Anthropic · Proprietary

1555+7/-7

10,446

$5 / $25

515

claude-sonnet-5-high

Anthropic · Proprietary

1546+11/-11

3,409

$2 / $10

715

claude-opus-4-6-thinking

Anthropic · Proprietary

1543+6/-6

13,377

$5 / $25

617

muse-spark-1.1

Meta · Proprietary

1540+12/-12

2,569

$1.25 / $4.25

N/A

717

gemini-3.6-flash

Google · Proprietary

1537+13/-13

2,278

$1.50 / $7.50

N/A

916

claude-opus-4-6

Anthropic · Proprietary

1536+6/-6

14,567

$5 / $25

917

claude-opus-4-8

Anthropic · Proprietary

1534+8/-8

6,479

$5 / $25

919

seed-2.1-pro-preview

Bytedance · Proprietary

1531+10/-10

4,360

N/A

1120

glm-5.1

Z.ai · MIT

1525+8/-8

6,332

$1.40 / $4.40

202.8K

1220

claude-sonnet-4-6

Anthropic · Proprietary

1522+6/-6

16,761

$3 / $15

1521

qwen3.7-max-20260517

Alibaba · Proprietary

1516+8/-8

6,915

$1.48 / $4.42

1521

kimi-k2.6

Moonshot · Modified MIT

1515+7/-7

9,390

$0.95 / $4

262.1K

1822

gpt-5.5-xhigh (codex-harness)

OpenAI · Proprietary

1506+7/-7

9,579

$5 / $30

N/A

1625

gemini-3.5-flash

Google · Proprietary

1504+13/-13

2,290

$1.50 / $9

2026

minimax-m3

MiniMax · MiniMax Community License

1492+8/-8

6,865

$0.60 / $2.40

N/A

2126

claude-opus-4-5-20251101-thinking-32k

Anthropic · Proprietary

1490+7/-7

13,063

$5 / $25

200K

2127

gemini-3.5-flash-medium

Google · Proprietary

1488+9/-9

6,137

$1.50 / $9

2228

gpt-5.5-high (codex-harness)

OpenAI · Proprietary

1483+7/-7

11,543

N/A

2130

qwen3.6-max-preview

Alibaba · Proprietary

1480+12/-12

2,545

$1.04 / $6.24

262.1K

2430

mimo-v2.5-pro

Xiaomi · MIT

1474+7/-7

9,963

$0.43 / $0.87

2532

kimi-k2.7-code

Moonshot · Modified MIT

1470+9/-9

4,677

$0.82 / $3.75

262.1K

2632

claude-opus-4-5-20251101

Anthropic · Proprietary

1466+6/-6

15,320

$5 / $25

200K

2835

qwen3.6-plus

Alibaba · Proprietary

1459+6/-6

12,411

$0.33 / $1.95

2835

deepseek-v4-pro-thinking

DeepSeek · MIT

1459+7/-7

9,430

$0.43 / $0.87

2639

gpt-5.4-high (codex-harness)

OpenAI · Proprietary

1457+17/-17

1,482

$2.50 / $15

1.1M

3039

gpt-5.5 (codex-harness)

OpenAI · Proprietary

1450+7/-7

9,692

N/A

3039

deepseek-v4-pro

DeepSeek · MIT

1446+7/-7

10,172

$0.43 / $0.87

3241

gemini-3.1-pro-preview

Google · Proprietary

1444+5/-5

17,979

$2 / $12

3244

glm-4.7

Z.ai · MIT

1440+10/-10

4,884

$0.40 / $1.75

202.8K

3244

gemini-3-pro

Google · Proprietary

1439+7/-7

17,159

$2 / $12

3244

gemini-3-flash

Google · Proprietary

1437+8/-8

13,283

$0.50 / $3

3045

gpt-5.4-medium (codex-harness)

OpenAI · Proprietary

1437+16/-16

1,449

$2.50 / $15

1.1M

3544

kimi-k2.5-thinking

Moonshot · Modified MIT

1433+6/-6

15,634

$0.60 / $3

N/A

3544

mimo-v2-pro

Xiaomi · Proprietary

1431+8/-8

6,870

$1 / $3

3644

glm-5

Z.ai · MIT

1430+8/-8

7,451

$1 / $3.20

202.8K

3645

mimo-v2.5

Xiaomi · MIT

1427+7/-7

9,085

$0.14 / $0.28

3648

inkling

Thinky · Apache 2.0

1426+12/-12

2,791

$1 / $4.05

4455

kimi-k2.5-instant

Moonshot · Modified MIT

1408+11/-11

3,615

$0.57 / $2.85

262.1K

4457

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1406+12/-12

2,965

$1.75 / $14

400K

4260

gpt-5.2

OpenAI · Proprietary

1406+17/-17

1,455

$1.75 / $14

400K

4460

glm-5v-turbo

Z.ai · Proprietary

1403+16/-16

1,497

$1.20 / $4

202.8K

4559

gpt-5.4-mini-high

OpenAI · Proprietary

1398+7/-7

10,587

$0.75 / $4.50

400K

4559

minimax-m2.7

MiniMax · Modified MIT

1396+6/-6

11,028

$0.25 / $1

204.8K

4559

qwen3.5-397b-a17b

Alibaba · Apache 2.0

1396+6/-6

15,122

$0.39 / $2.34

262.1K

4562

gpt-5-medium

OpenAI · Proprietary

1394+13/-13

3,756

$1.25 / $10

400K

4561

minimax-m2.1-preview

MiniMax · MIT

1392+8/-8

9,272

$0.30 / $1.20

204.8K

4562

gpt-5.1-medium

OpenAI · Proprietary

1391+10/-10

6,121

$1.25 / $10

400K

4662

claude-sonnet-4-5-20250929-thinking-32k

Anthropic · Proprietary

1388+7/-7

15,747

$3 / $15

200K

4761

gemini-3-flash (thinking-minimal)

Google · Proprietary

1388+5/-5

21,989

$0.50 / $3

4762

claude-sonnet-4-5-20250929

Anthropic · Proprietary

1386+6/-6

18,400

$3 / $15

200K

4663

claude-opus-4-1-20250805

Anthropic · Proprietary

1386+9/-9

8,568

$15 / $75

200K

4568

gpt-5.4

OpenAI · Proprietary

1385+19/-19

988

$2.50 / $15

1.1M

5066

minimax-m2.5

MiniMax · Modified MIT

1381+8/-8

7,861

$0.15 / $0.90

204.8K

5265

grok-4.20-beta-0309-reasoning

SpaceXAI · Proprietary

1381+6/-6

13,628

$2 / $6

5471

gpt-5.3-codex (codex-harness)

OpenAI · Proprietary

1371+11/-11

3,566

$1.75 / $14

400K

5971

deepseek-v3.2-thinking

DeepSeek · MIT

1368+8/-8

7,920

$0.27 / $0.40

163.8K

6071

gemma-4-31b

Google · Apache 2.0

1367+8/-8

6,808

$0.14 / $0.40

262.1K

6171

qwen3.5-122b-a10b

Alibaba · Apache 2.0

1364+7/-7

8,214

$0.26 / $2.08

262.1K

5873

hunyuan-hy3-preview

Tencent · tencent-hunyuan-community

1362+17/-17

1,378

N/A

6171

grok-4.3

SpaceXAI · Proprietary

1361+7/-7

8,901

$1.25 / $2.50

5973

gemma-4-26b-a4b

Google · Apache 2.0

1360+16/-16

1,513

N/A

6271

qwen3.5-27b

Alibaba · Apache 2.0

1356+8/-8

7,720

$0.26 / $2.60

262.1K

6272

glm-4.6

Z.ai · MIT

1355+9/-9

8,348

$0.50 / $2

202.8K

6273

laguna-m.1

Poolside · Apache 2.0

1353+10/-10

4,416

$0.20 / $0.40

262.1K

6877

gpt-5.1

OpenAI · Proprietary

1339+7/-7

12,870

$1.25 / $10

400K

6978

mimo-v2-flash (non-thinking)

Xiaomi · MIT

1337+8/-8

6,736

$0.10 / $0.30

262.1K

7278

gpt-5.2-codex

OpenAI · Proprietary

1334+8/-8

7,776

$1.75 / $14

400K

7278

deepseek-v3.2

DeepSeek · MIT

1332+7/-7

10,493

$0.27 / $0.40

163.8K

7278

gpt-5.1-codex

OpenAI · Proprietary

1330+10/-10

6,217

$1.25 / $10

400K

7278

kimi-k2-thinking-turbo

Moonshot · Modified MIT

1329+6/-6

15,348

$1.15 / $8

262.1K

7378

claude-haiku-4-5-20251001

Anthropic · Proprietary

1327+5/-5

26,368

$1 / $5

200K

7982

minimax-m2

MiniMax · Apache 2.0

1304+9/-9

8,397

$0.30 / $1.20

204.8K

7982

laguna-xs.2

Poolside · Apache 2.0

1303+11/-11

3,881

$0.10 / $0.20

262.1K

7983

mimo-v2-flash (thinking)

Xiaomi · MIT

1300+14/-14

2,101

$0.10 / $0.30

262.1K

7984

deepseek-v3.2-exp

DeepSeek · MIT

1288+11/-11

4,869

$0.27 / $0.41

163.8K

8184

qwen3-coder-480b-a35b-instruct

Alibaba · Apache 2.0

1281+7/-7

15,216

$0.40 / $1.60

262.1K

8290

mistral-medium-3.5

Mistral · Modified MIT

1267+15/-15

2,166

$1.50 / $7.50

262.1K

8492

KAT-Coder-Pro-V1

Proprietary

1259+16/-16

1,879

$0.21 / $0.83

256K

8490

gemini-3.1-flash-lite-preview

Google · Proprietary

1253+7/-7

13,573

$0.25 / $1.50

8492

qwen3.5-35b-a3b

Alibaba · Apache 2.0

1250+16/-16

1,815

$0.14 / $1

262.1K

8493

trinity-large-thinking

Apache 2.0

1243+19/-19

1,321

$0.25 / $0.80

262.1K

8493

gpt-5.1-codex-mini

OpenAI · Proprietary

1240+18/-18

1,445

$0.25 / $2

400K

8493

qwen3.5-flash

Alibaba · Proprietary

1237+17/-17

1,561

N/A

8693

grok-4-1-fast-reasoning

SpaceXAI · Proprietary

1234+9/-9

6,907

$0.20 / $0.50

8696

mistral-large-3

Mistral · Apache 2.0

1223+20/-20

1,034

$0.50 / $1.50

N/A

8896

grok-4.1-thinking

SpaceXAI · Proprietary

1209+20/-20

1,209

N/A

9296

gemini-2.5-pro

Google · Proprietary

1204+13/-13

3,299

$1.25 / $10

9297

devstral-2

Mistral · Modified MIT

1200+17/-17

1,588

N/A

9297

granite-4.1-8b

IBM · Apache 2.0

1200+17/-17

1,759

$0.05 / $0.10

131.1K

9599

mercury-2

Inception AI · Proprietary

1164+23/-23

947

$0.25 / $0.75

128K

9799

grok-4-fast-reasoning

SpaceXAI · Proprietary

1151+23/-23

935

$0.20 / $0.50

9799

grok-code-fast-1

SpaceXAI · Proprietary

1140+22/-22

981

$0.20 / $1.50

N/A

100

100100

devstral-medium-2507

Mistral · Proprietary

1093+23/-23

993

$0.40 / $2

128K

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)

Domain

Code Arena | WebDev🏆Overall

Remove Style Control Leaderboard Plots

Confidence Intervals on Model Strength (via Bootstrapping)

Fraction of Model A Wins for All Non-tied A vs. B Battles

Battle Count for Each Combination of Models (without Ties)

Average Win Rate Against All Other Models (Uniform Sampling and No Ties)