Выпущен Claude Opus 4.5: результат 80.9% на SWE-bench превышает показатели всех людей и ИИ-моделей
Anthropic выпускает Claude Opus 4.5 с революционным результатом 80.9% на SWE-bench, впервые превышая человеческий уровень производительности в задачах разработки программного обеспечения.
Срочно: Claude Opus 4.5 превзошёл каждого программиста-человека
Claude Opus 4.5 от Anthropic достиг беспрецедентного: 80.9% на SWE-bench Verified, превзойдя не только каждую ИИ-модель, но и людей-инженеров. Это историческая веха в развитии ИИ.
Результаты бенчмарков
Claude Opus 4.5 доминирует по всем основным бенчмаркам программирования:
SWE-bench Verified: 80.9% (против 74.2% у GPT-5.1, 71.8% у Gemini 3 Pro) HumanEval: 97.3% (практически идеальная генерация кода) MBPP: 96.1% (задачи программирования на Python) Скорость программирования: среднее время ответа 3.2 секундыКонкурентный ландшафт
| Модель | SWE-bench | Цена входа | Цена выхода |
| Claude Opus 4.5 | 80.9% | $15/M токенов | $75/M токенов |
| GPT-5.1 | 74.2% | $10/M токенов | $30/M токенов |
| Gemini 3 Pro | 71.8% | $7/M токенов | $21/M токенов |
| Claude Sonnet 4.5 | 73.5% | $3/M токенов | $15/M токенов |
Технические инновации
Эффективность токенов: Новые алгоритмы сжатия сокращают требования к входным данным на 30% при сохранении качества. Параметр усилия: Настраиваемая интенсивность рассуждений позволяет разработчикам балансировать стоимость и производительность для задач разной сложности. Мультиязычное превосходство: Поддержка на уровне носителя для Python, JavaScript, TypeScript, Java, C++, Go и Rust.Реальные применения
Агентные поисковые возможности
Claude Opus 4.5 может автономно навигировать по кодовым базам, выявлять зависимости и предлагать комплексные решения для нескольких файлов.
Улучшенное использование компьютера
Улучшенная способность взаимодействовать со средами разработки, запускать тесты и итерировать код на основе обратной связи.
Комплексные рабочие процессы
От анализа требований до скриптов развёртывания — Opus 4.5 обрабатывает полные циклы разработки с минимальным вмешательством человека.
Доступ и наличие
Доступ к API: Доступно сейчас через Anthropic API по цене $15/$75 за миллион токенов Облачные платформы: AWS Bedrock и Google Cloud Vertex AI (ожидается в 1 кв. 2026) Потребительские приложения: Подписчики claude.ai Pro получают приоритетный доступИспользуйте Opus 4.5, если...
- Создаёте приложения промышленного уровня, требующие высочайшего качества кода
- Работаете над сложным рефакторингом или архитектурными изменениями
- Нужна комплексная генерация тестового покрытия
- Требуется понимание мультиязычной кодовой базы
- Бюджет позволяет премиальные цены за премиальные результаты
Заключение
Claude Opus 4.5 представляет смену парадигмы в ИИ-ассистированной разработке программного обеспечения. Впервые ИИ-система не просто сравнялась, а превзошла среднюю человеческую производительность в реальных инженерных задачах. Хотя цены остаются премиальными, рост продуктивности оправдывает инвестиции для серьёзных команд разработчиков.
Вопрос уже не в том, может ли ИИ программировать — а в том, как быстро люди-разработчики адаптируются к ИИ-сотрудникам, которые превосходят их.