BenchmarkFebruary 17, 2026

Claude Sonnet 4.6 Atteint 72,5 % sur OSWorld, Égalant Opus pour l'Utilisation d'Ordinateurs

Sonnet 4.6 égale Opus 4.6 sur les benchmarks d'utilisation d'ordinateurs, permettant une automatisation desktop sophistiquée aux tarifs mid-tier.

L'Utilisation d'Ordinateurs Démocratisée

Le score de 72,5 % de Sonnet 4.6 sur OSWorld-Verified égale essentiellement les 72,7 % d'Opus 4.6.

Comparaison des Performances

ModèleOSWorld-VerifiedPrix
Opus 4.672,7 %15 $/75 $
Sonnet 4.672,5 %3 $/15 $
Sonnet 4.561,4 %3 $/15 $
GPT-5.2~65 %1,75 $/14 $

Sonnet 4.6 a progressé de 11+ points par rapport à Sonnet 4.5.

Capacités Pratiques

Automatisation Web

  • Remplissage de formulaires complexes avec validation
  • Navigation dans des flux de paiement multi-étapes

Tâches Desktop

  • Manipulation de tableurs
  • Traitement de documents entre applications
  • Gestion de systèmes de fichiers

Impact Tarifaire

Un déploiement entreprise typique :

  • Opus 4.6 : ~1 500 $/mois pour 20K tâches
  • Sonnet 4.6 : ~300 $/mois pour les mêmes tâches

Réduction de 80 % des coûts avec des performances équivalentes.

Ready to Experience Claude 5?

Try Now