Выпущен Claude Opus 4.5: результат 80.9% на SWE-bench превышает показатели всех людей и ИИ-моделей

Срочно: Claude Opus 4.5 превзошёл каждого программиста-человека

Claude Opus 4.5 от Anthropic достиг беспрецедентного: 80.9% на SWE-bench Verified, превзойдя не только каждую ИИ-модель, но и людей-инженеров. Это историческая веха в развитии ИИ.

Результаты бенчмарков

Claude Opus 4.5 доминирует по всем основным бенчмаркам программирования:

SWE-bench Verified: 80.9% (против 74.2% у GPT-5.1, 71.8% у Gemini 3 Pro) HumanEval: 97.3% (практически идеальная генерация кода) MBPP: 96.1% (задачи программирования на Python) Скорость программирования: среднее время ответа 3.2 секунды

Конкурентный ландшафт

Модель

SWE-bench

Цена входа

Цена выхода

Claude Opus 4.5

80.9%

$15/M токенов

$75/M токенов

GPT-5.1

74.2%

$10/M токенов

$30/M токенов

Gemini 3 Pro

71.8%

$7/M токенов

$21/M токенов

Claude Sonnet 4.5

73.5%

$3/M токенов

$15/M токенов

Технические инновации

Эффективность токенов: Новые алгоритмы сжатия сокращают требования к входным данным на 30% при сохранении качества. Параметр усилия: Настраиваемая интенсивность рассуждений позволяет разработчикам балансировать стоимость и производительность для задач разной сложности. Мультиязычное превосходство: Поддержка на уровне носителя для Python, JavaScript, TypeScript, Java, C++, Go и Rust.

Реальные применения

Агентные поисковые возможности

Claude Opus 4.5 может автономно навигировать по кодовым базам, выявлять зависимости и предлагать комплексные решения для нескольких файлов.

Улучшенное использование компьютера

Улучшенная способность взаимодействовать со средами разработки, запускать тесты и итерировать код на основе обратной связи.

Комплексные рабочие процессы

От анализа требований до скриптов развёртывания — Opus 4.5 обрабатывает полные циклы разработки с минимальным вмешательством человека.

Доступ и наличие

Доступ к API: Доступно сейчас через Anthropic API по цене $15/$75 за миллион токенов Облачные платформы: AWS Bedrock и Google Cloud Vertex AI (ожидается в 1 кв. 2026) Потребительские приложения: Подписчики claude.ai Pro получают приоритетный доступ

Используйте Opus 4.5, если...

Создаёте приложения промышленного уровня, требующие высочайшего качества кода

Работаете над сложным рефакторингом или архитектурными изменениями

Нужна комплексная генерация тестового покрытия

Требуется понимание мультиязычной кодовой базы

Бюджет позволяет премиальные цены за премиальные результаты

Заключение

Claude Opus 4.5 представляет смену парадигмы в ИИ-ассистированной разработке программного обеспечения. Впервые ИИ-система не просто сравнялась, а превзошла среднюю человеческую производительность в реальных инженерных задачах. Хотя цены остаются премиальными, рост продуктивности оправдывает инвестиции для серьёзных команд разработчиков.

Вопрос уже не в том, может ли ИИ программировать — а в том, как быстро люди-разработчики адаптируются к ИИ-сотрудникам, которые превосходят их.