Урок

Использование компьютера в Claude Sonnet 4.6: Полное руководство по реализации

Создавайте агентов для работы с компьютером с помощью Claude Sonnet 4.6: результат OSWorld 72.5%, паттерны реализации, соображения безопасности и реальные применения.

February 2026

Краткий обзор

Claude Sonnet 4.6 достигает 72.5% на OSWorld-Verified — совпадая с 72.7% у Opus 4.6 при 1/5 стоимости. Использование компьютера позволяет AI-агентам управлять рабочими столами, просматривать веб, заполнять формы и автоматизировать сложные рабочие процессы. Доступно через API с надлежащими мерами безопасности.

Что такое использование компьютера?

Использование компьютера позволяет Claude:

    • Просматривать скриншоты и понимать элементы UI
      • Управлять движениями и кликами мыши
        • Вводить текст с клавиатуры
          • Навигировать по приложениям и веб-сайтам
            • Выполнять многошаговые рабочие процессы автономно

            Результаты бенчмарков

            МодельOSWorld-VerifiedСтоимость (вход/выход)
            Sonnet 4.672.5%$3/$15
            Opus 4.672.7%$15/$75
            GPT-5.2~65%$1.75/$14
            Gemini 3 Pro~60%$1.25/$5

            Sonnet 4.6 обеспечивает использование компьютера уровня Opus по ценам Sonnet.

            Соображения безопасности

            Обязательные меры безопасности

              • Песочница: Запускайте в VM или контейнере для изоляции от хост-системы
                • Подтверждение: Требуйте одобрения человека для чувствительных действий
                  • Блоклисты: Запрещайте доступ к чувствительным URL, приложениям или директориям
                    • Мониторинг: Логируйте все действия для аудиторского следа
                      • Ограничение частоты: Предотвращайте неконтролируемое выполнение с лимитами действий

                      Применения

                      1. Автоматизация форм

                      run_computer_agent(
                      

                      "Fill out the expense report form with: "

                      "Date: 2026-02-17, Amount: $145.50, Category: Travel, "

                      "Description: Client meeting transportation"

                      )

                      2. Извлечение данных

                      run_computer_agent(
                      

                      "Open the quarterly report PDF, extract the revenue figures "

                      "from Q1-Q4, and paste them into the spreadsheet in column B"

                      )

                      3. Автоматизация тестирования

                      run_computer_agent(
                      

                      "Navigate to the login page, test these credentials: "

                      "user: [email protected], pass: Test123. "

                      "Verify the dashboard loads correctly and report any errors."

                      )

                      Лучшие практики

                        • Ясные инструкции: Будьте конкретны в отношении элементов UI и ожидаемых результатов
                          • Разбиение задач: Разбивайте сложные рабочие процессы на отдельные шаги
                            • Восстановление после ошибок: Включите инструкции по обработке неожиданных состояний
                              • Частота скриншотов: Запрашивайте свежие скриншоты после важных действий
                                • Обработка таймаутов: Реализуйте максимальное количество действий на задачу

                      Ограничения

                        • Нет обработки видео в реальном времени (на основе скриншотов)
                          • Могут возникнуть сложности с динамическими/анимированными элементами UI
                            • Требует видимости экрана (нет headless-режима)
                              • Более высокая задержка по сравнению с традиционной автоматизацией

                              Заключение

                              Функция использования компьютера в Sonnet 4.6 обеспечивает sophisticated автоматизацию рабочего стола по доступным ценам. С надлежащими мерами безопасности она может превратить ручные рабочие процессы в автоматизированные — от заполнения форм до извлечения данных и QA-тестирования.

Ready to Experience Claude 5?

Try Now