튜토리얼

Claude Sonnet 4.6 컴퓨터 사용: 완전 구현 가이드

Claude Sonnet 4.6으로 컴퓨터 사용 에이전트 구축: OSWorld 72.5% 점수, 구현 패턴, 안전 고려 사항, 실제 응용 프로그램.

February 2026

요약

Claude Sonnet 4.6은 OSWorld-Verified에서 72.5%를 달성합니다 - 1/5 비용으로 Opus 4.6의 72.7%에 맞먹습니다. 컴퓨터 사용은 AI 에이전트가 데스크탑을 제어하고, 웹을 탐색하고, 양식을 작성하고, 복잡한 워크플로우를 자동화할 수 있게 합니다. 적절한 안전 제어와 함께 API를 통해 사용 가능합니다.

컴퓨터 사용이란?

컴퓨터 사용은 Claude가 다음을 할 수 있게 합니다:

    • 스크린샷을 보고 UI 요소를 이해
      • 마우스 이동과 클릭 제어
        • 키보드 입력
          • 애플리케이션과 웹사이트 탐색
            • 멀티 스텝 워크플로우를 자율적으로 완료

            벤치마크 성능

            모델OSWorld-Verified비용 (입력/출력)
            Sonnet 4.672.5%$3/$15
            Opus 4.672.7%$15/$75
            GPT-5.2~65%$1.75/$14
            Gemini 3 Pro~60%$1.25/$5

            Sonnet 4.6은 Sonnet 가격으로 Opus 수준의 컴퓨터 사용을 제공합니다.

            안전 고려 사항

            필수 안전장치

              • 샌드박싱: 호스트 시스템으로부터 격리하기 위해 VM 또는 컨테이너에서 실행
                • 확인: 민감한 작업에 대한 인간 승인 요구
                  • 차단 목록: 민감한 URL, 애플리케이션 또는 디렉토리 접근 방지
                    • 모니터링: 감사 추적을 위해 모든 작업 로깅
                      • 속도 제한: 작업 제한으로 폭주 에이전트 방지

                      사용 사례

                      1. 양식 자동화

                      run_computer_agent(
                      

                      "경비 보고서 양식 작성: "

                      "날짜: 2026-02-17, 금액: $145.50, 카테고리: 출장, "

                      "설명: 고객 미팅 교통비"

                      )

                      2. 데이터 추출

                      run_computer_agent(
                      

                      "분기별 보고서 PDF를 열고, Q1-Q4 매출 수치를 추출하고, "

                      "스프레드시트의 B열에 붙여넣기"

                      )

                      3. 테스트 자동화

                      run_computer_agent(
                      

                      "로그인 페이지로 이동하여 이 자격 증명으로 테스트: "

                      "사용자: [email protected], 비밀번호: Test123. "

                      "대시보드가 올바르게 로드되는지 확인하고 오류를 보고."

                      )

                      모범 사례

                        • 명확한 지시: UI 요소와 예상 결과에 대해 구체적으로
                          • 분할된 작업: 복잡한 워크플로우를 개별 단계로 분리
                            • 오류 복구: 예기치 않은 상태 처리 지침 포함
                              • 스크린샷 빈도: 주요 작업 후 새 스크린샷 요청
                                • 타임아웃 처리: 작업당 최대 작업 수 구현

                      제한 사항

                        • 실시간 비디오 처리 없음 (스크린샷 기반)
                          • 동적/애니메이션 UI 요소에서 어려울 수 있음
                            • 화면 가시성 필요 (헤드리스 모드 불가)
                              • 전통적인 자동화보다 높은 지연 시간

                              결론

                              Sonnet 4.6의 컴퓨터 사용 기능은 접근 가능한 가격으로 정교한 데스크탑 자동화를 가능하게 합니다. 적절한 안전 제어와 함께 양식 작성에서 데이터 추출, QA 테스트까지 수동 워크플로우를 자동화된 프로세스로 변환할 수 있습니다.

Ready to Experience Claude 5?

Try Now