チュートリアル
Claude Sonnet 4.6 コンピューター使用: 完全実装ガイド
Claude Sonnet 4.6でコンピューター使用エージェントを構築する。OSWorldスコア72.5%、実装パターン、安全上の考慮事項、実世界アプリケーション。
February 2026
要約
Claude Sonnet 4.6はOSWorld-Verifiedで72.5%を達成し、Opus 4.6の72.7%に1/5のコストで匹敵しています。コンピューター使用により、AIエージェントがデスクトップの制御、Webの閲覧、フォームの入力、複雑なワークフローの自動化が可能になります。適切な安全制御のもとAPIから利用可能です。
コンピューター使用とは?
コンピューター使用により、Claudeは以下が可能になります:
- スクリーンショットの表示とUI要素の理解
- マウスの移動とクリックの制御
- キーボード入力の入力
- アプリケーションとウェブサイトのナビゲーション
- マルチステップワークフローの自律完了
- サンドボックス:ホストシステムから分離するためにVMまたはコンテナで実行
- 確認:機密性の高い操作には人間の承認を要求
- ブロックリスト:機密性の高いURL、アプリケーション、ディレクトリへのアクセスを防止
- モニタリング:監査証跡のためにすべての操作をログ
- レート制限:操作制限で暴走エージェントを防止
- フォーム自動化
- データ抽出
- テスト自動化
ベンチマークパフォーマンス
| モデル | OSWorld-Verified | コスト(入力/出力) |
|---|
| Sonnet 4.6 | 72.5% | $3/$15 |
| Opus 4.6 | 72.7% | $15/$75 |
| GPT-5.2 | 約65% | $1.75/$14 |
| Gemini 3 Pro | 約60% | $1.25/$5 |
安全上の考慮事項
必須のセーフガード
ユースケース
結論
Sonnet 4.6のコンピューター使用機能は、アクセス可能な価格で洗練されたデスクトップ自動化を実現します。適切な安全制御により、フォーム入力からデータ抽出、QAテストまで手動ワークフローを自動化プロセスに変革できます。