앤트로픽(Anthropic)이 현존하는 코딩 모델 중 가장 강력한 성능을 자랑하는 ‘클로드 소넷 4.5(Claude Sonnet 4.5)’를 29일(현지 시각) 공개했다. 앤트로픽에 따르면 클로드 소넷 4.5는 실제 소프트웨어 코딩 능력을 측정하는 SWE-bench Verified 평가에서 최고 수준의 성능을 기록했다. 복잡한 다단계 작업에서 30시간 이상 집중력을 유지하는 능력을 보였다는 게 회사 측 설명이다.
컴퓨터 사용 분야에서도 큰 진전을 이뤘다. 실제 컴퓨터 작업에서 AI 모델을 테스트하는 벤치마크인 OSWorld에서 소넷 4.5는 61.4%로 1위를 차지했다. 불과 4개월 전 소넷 4가 42.2%로 선두를 차지했던 것과 비교하면 큰 발전이다. 금융, 법률, 의학, STEM 분야 전문가들은 소넷 4.5가 오푸스 4.1(Opus 4.1)을 포함한 이전 모델들과 비교해 훨씬 뛰어난 분야별 지식과 추론 능력을 보인다고 평가했다.
앤트로픽은 이번 출시와 함께 제품 전반에 걸쳐 대규모 업그레이드를 진행했다. 클로드 코드(Claude Code)에는 작업 진행 상황을 저장하고 이전 상태로 되돌릴 수 있는 체크포인트 기능이 추가됐다. 클로드 API(Claude API)에는 새로운 컨텍스트 편집 기능과 메모리 도구가 추가돼 에이전트가 더 복잡한 작업을 처리할 수 있게 됐다.
개발자들을 위해서는 클로드 코드 제작에 사용한 구성 요소를 ‘클로드 에이전트 SDK(Claude Agent SDK)’로 공개했다. 앤트로픽의 최첨단 제품을 구동하는 인프라를 이제 개발자들도 활용할 수 있게 된 것이다.
앤트로픽은 클로드 소넷 4.5가 지금까지 출시한 최전선 모델 중 가장 정렬이 잘된 모델이라고 강조했다. 아첨, 속임수, 권력 추구, 망상적 사고 조장 같은 우려되는 행동이 이전 모델 대비 크게 감소했다는 설명이다.
클로드 소넷 4.5는 오늘부터 클로드 API를 통해 ‘claude-sonnet-4-5’로 사용할 수 있다. 가격은 클로드 소넷 4와 동일하게 100만 토큰당 3달러/15달러다.
해당 모델에 대한 자세한 사항은 앤트로픽 뉴스룸에서 확인 가능하다.
이미지 출처: 앤트로픽