튜토리얼
Claude Sonnet 4.6 컴퓨터 사용: 완전 구현 가이드
Claude Sonnet 4.6으로 컴퓨터 사용 에이전트 구축: OSWorld 72.5% 점수, 구현 패턴, 안전 고려 사항, 실제 응용 프로그램.
February 2026
요약
Claude Sonnet 4.6은 OSWorld-Verified에서 72.5%를 달성합니다 - 1/5 비용으로 Opus 4.6의 72.7%에 맞먹습니다. 컴퓨터 사용은 AI 에이전트가 데스크탑을 제어하고, 웹을 탐색하고, 양식을 작성하고, 복잡한 워크플로우를 자동화할 수 있게 합니다. 적절한 안전 제어와 함께 API를 통해 사용 가능합니다.
컴퓨터 사용이란?
컴퓨터 사용은 Claude가 다음을 할 수 있게 합니다:
- 스크린샷을 보고 UI 요소를 이해
- 마우스 이동과 클릭 제어
- 키보드 입력
- 애플리케이션과 웹사이트 탐색
- 멀티 스텝 워크플로우를 자율적으로 완료
- 샌드박싱: 호스트 시스템으로부터 격리하기 위해 VM 또는 컨테이너에서 실행
- 확인: 민감한 작업에 대한 인간 승인 요구
- 차단 목록: 민감한 URL, 애플리케이션 또는 디렉토리 접근 방지
- 모니터링: 감사 추적을 위해 모든 작업 로깅
- 속도 제한: 작업 제한으로 폭주 에이전트 방지
- 명확한 지시: UI 요소와 예상 결과에 대해 구체적으로
- 분할된 작업: 복잡한 워크플로우를 개별 단계로 분리
- 오류 복구: 예기치 않은 상태 처리 지침 포함
- 스크린샷 빈도: 주요 작업 후 새 스크린샷 요청
- 타임아웃 처리: 작업당 최대 작업 수 구현
- 실시간 비디오 처리 없음 (스크린샷 기반)
- 동적/애니메이션 UI 요소에서 어려울 수 있음
- 화면 가시성 필요 (헤드리스 모드 불가)
- 전통적인 자동화보다 높은 지연 시간
벤치마크 성능
| 모델 | OSWorld-Verified | 비용 (입력/출력) |
|---|
| Sonnet 4.6 | 72.5% | $3/$15 |
| Opus 4.6 | 72.7% | $15/$75 |
| GPT-5.2 | ~65% | $1.75/$14 |
| Gemini 3 Pro | ~60% | $1.25/$5 |
Sonnet 4.6은 Sonnet 가격으로 Opus 수준의 컴퓨터 사용을 제공합니다.
안전 고려 사항
필수 안전장치
사용 사례
1. 양식 자동화
run_computer_agent("경비 보고서 양식 작성: "
"날짜: 2026-02-17, 금액: $145.50, 카테고리: 출장, "
"설명: 고객 미팅 교통비"
)
2. 데이터 추출
run_computer_agent("분기별 보고서 PDF를 열고, Q1-Q4 매출 수치를 추출하고, "
"스프레드시트의 B열에 붙여넣기"
)
3. 테스트 자동화
run_computer_agent("로그인 페이지로 이동하여 이 자격 증명으로 테스트: "
"사용자: [email protected], 비밀번호: Test123. "
"대시보드가 올바르게 로드되는지 확인하고 오류를 보고."
)
모범 사례
제한 사항
결론
Sonnet 4.6의 컴퓨터 사용 기능은 접근 가능한 가격으로 정교한 데스크탑 자동화를 가능하게 합니다. 적절한 안전 제어와 함께 양식 작성에서 데이터 추출, QA 테스트까지 수동 워크플로우를 자동화된 프로세스로 변환할 수 있습니다.