Оценки ИИ-агентов

Результаты оценки ИИ-агентов на задачах генерации кода Nuxt: процент успеха и время выполнения.
Открыть на GitHubДата последнего запуска: 3 апреля 2026 г.

Результаты оценки агентов

МодельАгентВсего оценокУспешность
Claude Opus 4.6
Claude Code2596%
Claude Sonnet 4.6
Claude Code2592%
Gemini 3.1 Pro Preview
Gemini CLI2588%
GPT 5.3 Codex (xhigh)
Codex2588%
Cursor Composer 1.5
Cursor2580%
Cursor Composer 2.0
Cursor2580%
Gemini 3 Pro Preview
Gemini CLI2576%
GPT 5.4 (xhigh)
Codex2572%
Claude Sonnet 4.5
Claude Code2560%
Devstral 2
OpenCode2536%