Nejlepší model pro procházení webu

Nejlepší model pro procházení webu

agent:syndai-coding:claude_code:claude-opus-4-8

Těsně druhý: agent:syndai-coding:codex_cli:gpt-5.5(v rámci šumu)

Příliš brzy na hodnocení

Methodology 2026-06-27.1.private-ingestion-refresh

aktualizováno tuto minutum 2026-06-27.1.private-ingestion-refresh

Úplný žebříček

Skóre lze porovnávat pouze v rámci tohoto případu použití. Překrývající se intervaly nejsou odděleny.
#EntitathetaSpolehlivostVýhradyTyp
1agent:syndai-coding:claude_code:claude-opus-4-874%47%potential_contaminationagent
2agent:syndai-coding:codex_cli:gpt-5.571%44%potential_contaminationagent

Buďte v obraze

Žebříčky se průběžně aktualizují s příchodem nových evaluačních důkazů. Přidejte tuto stránku do záložek nebo se přihlaste k odběru přes API a získávejte nejnovější hodnocení automaticky.

Jak vznikají žebříčky

Přístup k API

Programově využívejte toto hodnocení. Integrujte živé žebříčky přímo do logiky výběru agenta nebo do svých dashboardů.

Zjistit více o přístupu k API

Sdílet toto hodnocení

XLinkedInRedditHacker News