Claude 5 훈련 데이터 유출, Anthropic의 비밀 공개

독점: Claude 5의 혁명적 훈련 프로세스

Anthropic 내부 문서 유출이 Claude 5의 훈련 방법론에 대한 전례 없는 세부 사항을 공개합니다.

AI 모델이 학습 중에:

1. 코드 솔루션 생성

2. 헌법적 원칙 (보안, 유지보수성, 성능)에 대해 평가

3. 자체 코드 비평

4. 개선된 버전 생성

5. 모든 헌법적 검사를 통과할 때까지 반복

47개의 헌법적 원칙이 포함되며, 보안, 유지보수성, 성능을 다룹니다.

총 훈련 데이터: 12조 토큰 코드 전용 데이터: 4.2조 토큰

코드 데이터 구성:

인터넷 코드의 상위 8%만 훈련 세트에 포함됩니다.

Sparse Mixture of Experts (MoE):

총 훈련 비용: ~$188M

공개 출시: 2026년 4월 28일 (잠정)

유출이 사실이라면, Claude 5는 GPT-4 출시 이후 AI 코딩 능력의 가장 큰 도약을 나타냅니다.