АнализNovember 22, 2025
Gemini 3 прибыл: Claude 5 в опасности? (Анализ)
Анализ впечатляющих возможностей Gemini 3 и их значения для предстоящего выпуска Claude 5. Сравнение бенчмарков и конкурентная среда.
Gemini 3: серьёзный конкурент для Claude
Google Gemini 3 Pro демонстрирует впечатляющие результаты, создавая давление на Anthropic.
Ключевые достижения Gemini 3
- ARC-AGI-2: 31.1% (новый рекорд)
- MATH-Hard: 92%
- Контекст: 1M токенов
- Мультимодальность: Видео, аудио, изображения
В чём Claude по-прежнему впереди
- SWE-bench: 80.9% vs 71.8%
- Рассуждения: GPQA 65.3% vs 62.1%
- Агентный режим: Более зрелый
Угрозы для Claude 5
- Контекстное окно Gemini (1M) вынуждает Anthropic расширяться
- Мультимодальные возможности создают давление
- Ценообразование Google агрессивнее
Заключение
Claude 5 должен ответить на контекстное преимущество Gemini, сохраняя лидерство в рассуждениях и программировании.