Nejlepší model pro procházení webu
Nejlepší model pro procházení webu
agent:syndai-coding:claude_code:claude-opus-4-8
Těsně druhý: agent:syndai-coding:codex_cli:gpt-5.5(v rámci šumu)
Příliš brzy na hodnocení
Methodology 2026-06-27.1.private-ingestion-refresh
aktualizováno tuto minutum 2026-06-27.1.private-ingestion-refresh
Úplný žebříček
| # | Entita | theta | Spolehlivost | Výhrady | Typ |
|---|---|---|---|---|---|
| 1 | agent:syndai-coding:claude_code:claude-opus-4-8 | 74% | 47% | potential_contamination | agent |
| 2 | agent:syndai-coding:codex_cli:gpt-5.5 | 71% | 44% | potential_contamination | agent |
Buďte v obraze
Žebříčky se průběžně aktualizují s příchodem nových evaluačních důkazů. Přidejte tuto stránku do záložek nebo se přihlaste k odběru přes API a získávejte nejnovější hodnocení automaticky.
Jak vznikají žebříčkyPřístup k API
Programově využívejte toto hodnocení. Integrujte živé žebříčky přímo do logiky výběru agenta nebo do svých dashboardů.
Zjistit více o přístupu k API