Оценки ИИ-агентов
Результаты оценки ИИ-агентов на задачах генерации кода Nuxt: процент успеха и время выполнения.
Результаты оценки агентов
| Модель | Агент | Всего оценок | Успешность | |
|---|---|---|---|---|
Claude Opus 4.6 | Claude Code | 25 | 96% | |
Claude Sonnet 4.6 | Claude Code | 25 | 92% | |
Gemini 3.1 Pro Preview | Gemini CLI | 25 | 88% | |
GPT 5.3 Codex (xhigh) | Codex | 25 | 88% | |
Cursor Composer 1.5 | Cursor | 25 | 84% | |
Gemini 3 Pro Preview | Gemini CLI | 25 | 80% | |
Claude Sonnet 4.5 | Claude Code | 25 | 64% | |
Devstral 2 | OpenCode | 25 | 36% |