• Home
  • News
  • 앤트로픽, 코딩 성능 뛰어난 클로드 4 출시… 개발자 워크플로우 통합 강화

앤트로픽, 코딩 성능 뛰어난 클로드 4 출시… 개발자 워크플로우 통합 강화

앤트로픽, 코딩 성능 뛰어난 클로드 4 출시... 개발자 워크플로우 통합 강화
이미지 출처: 앤트로픽

앤트로픽(Anthropic)이 차세대 클로드(Claude) 모델인 ‘클로드 오퍼스 4(Claude Opus 4)’와 ‘클로드 소넷 4(Claude Sonnet 4)’를 출시했다. 이번 신규 모델은 코딩, 고급 추론 및 AI 에이전트 부문에서 새로운 표준을 제시한다.

앤트로픽에 따르면, 클로드 오퍼스 4는 세계 최고의 코딩 모델로, 복잡하고 장시간 실행되는 작업과 에이전트 워크플로우에서 지속적인 성능을 보인다. 클로드 소넷 4는 클로드 소넷 3.7의 중요한 업그레이드 버전으로, 우수한 코딩 및 추론 능력을 제공하며 사용자 지시에 더 정확하게 응답한다.

앤트로픽은 이번 모델 출시와 함께 여러 기능도 함께 발표했다. 도구 사용이 가능한 확장 사고(Extended thinking with tool use) 베타 버전을 통해 두 모델 모두 웹 검색과 같은 도구를 사용할 수 있게 되었다. 클로드는 이제 추론과 도구 사용을 번갈아 활용하여 응답 품질을 향상시킬 수 있다.



주요 기업들의 클로드 4 도입 및 평가

클로드 오퍼스 4와 소넷 4의 출시와 함께 이를 활용하는 주요 기업들의 평가와 도입 사례가 함께 공개됐다.

커서(Cursor)는 클로드 오퍼스 4를 코딩에 있어 최첨단이며 복잡한 코드베이스 이해에 큰 도약이라고 평가했다. 레플릿(Replit)은 정밀도 향상과 여러 파일에 걸친 복잡한 변경에 대한 획기적인 발전을 보고했다.

블록(Block)은 이를 코드 편집 및 디버깅 중 코드 품질을 향상시키는 최초의 모델이라고 부르며, 코드명 ‘goose’ 에이전트에서 완전한 성능과 신뢰성을 유지한다고 평가했다. 라쿠텐(Rakuten)은 7시간 동안 독립적으로 실행되는 까다로운 오픈소스 리팩터링으로 그 능력을 검증했다. 코그니션(Cognition)은 오퍼스 4가 다른 모델이 해결하지 못하는 복잡한 문제를 뛰어나게 해결하며, 이전 모델이 놓친 중요한 작업을 성공적으로 처리한다고 언급했다.

깃허브(GitHub)는 클로드 소넷 4가 에이전트 시나리오에서 뛰어나다고 평가하며, 깃허브 코파일럿(GitHub Copilot)의 새로운 코딩 에이전트를 구동하는 모델로 도입할 예정이라고 밝혔다. 매너스(Manus)는 복잡한 지시 사항 준수, 명확한 추론, 미적 출력의 향상을 강조했다.

아이젠트(iGent)는 소넷 4가 자율적인 다중 기능 앱 개발, 크게 향상된 문제 해결 능력, 코드베이스 탐색에 뛰어나다고 보고하며, 탐색 오류가 20%에서 거의 0에 가깝게 감소했다고 밝혔다. 소스그래프(Sourcegraph)는 이 모델이 소프트웨어 개발에 있어 상당한 도약을 보여준다고 평가하며, 더 오래 트랙을 유지하고, 문제를 더 깊이 이해하며, 더 우아한 코드 품질을 제공한다고 말했다. 어그먼트 코드(Augment Code)는 더 높은 성공률, 더 정밀한 코드 편집, 복잡한 작업의 더 신중한 처리를 보고하며, 이를 주요 모델로 선택했다.

새 모델의 주요 특징과 성능

클로드 오퍼스 4는 앤트로픽의 가장 강력한 모델이자 세계 최고의 코딩 모델로, SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 차지했다. 집중적인 노력과 수천 단계가 필요한 장시간 실행 작업에서 지속적인 성능을 제공하며, 여러 시간 동안 연속해서 작업할 수 있는 능력을 갖추고 있다. 이는 모든 소넷 모델을 크게 능가하며 AI 에이전트가 수행할 수 있는 작업 범위를 대폭 확장한다.

클로드 소넷 4는 소넷 3.7의 업계 선도적 기능을 크게 향상시켰으며, SWE-bench에서 72.7%의 최첨단 성능으로 코딩에 뛰어나다. 이 모델은 내부 및 외부 사용 사례에 대한 성능과 효율성의 균형을 맞추었으며, 구현에 대한 더 큰 제어를 위한 향상된 조종성을 갖추고 있다.

앤트로픽은 도구 사용을 통한 확장 사고, 병렬 도구 실행, 메모리 개선 외에도 모델이 작업 완료를 위해 지름길이나 허점을 사용하는 행동을 크게 줄였다고 밝혔다. 두 모델 모두 지름길과 허점에 특히 취약한 에이전트 작업에서 소넷 3.7보다 이러한 행동을 65% 덜 보인다.

클로드 오퍼스 4는 메모리 기능에서도 이전 모델을 크게 능가한다. 개발자가 클로드에 로컬 파일 접근 권한을 제공하는 애플리케이션을 구축할 때, 오퍼스 4는 핵심 정보를 저장하기 위한 ‘메모리 파일’을 생성하고 유지하는 데 능숙해진다.

클로드 코드 정식 출시와 개발자 통합

클로드 코드는 이제 정식 출시되어 터미널, 선호하는 IDE, 클로드 코드 SDK를 통한 백그라운드 실행 등 개발 워크플로우의 더 많은 부분에 클로드의 성능을 제공한다.

VS Code와 JetBrains용 새로운 베타 확장 프로그램은 클로드 코드를 IDE에 직접 통합한다. 클로드가 제안한 편집 내용이 파일에 인라인으로 표시되어 익숙한 편집기 인터페이스 내에서 검토 및 추적을 간소화한다.

IDE를 넘어, 앤트로픽은 확장 가능한 클로드 코드 SDK를 출시하여 클로드 코드와 동일한 핵심 에이전트를 사용하여 자체 에이전트와 애플리케이션을 구축할 수 있게 했다. 또한 SDK로 가능한 예시로 베타 버전인 ‘깃허브용 클로드 코드’를 출시했다.

이번 모델들은 전체 컨텍스트를 유지하고, 장기 프로젝트에 집중력을 유지하며, 혁신적인 영향을 주는 가상 협업자를 향한 큰 진전이다. 이 모델들은 ASL-3와 같은 높은 AI 안전 수준을 위한 조치를 구현하는 등 위험을 최소화하고 안전성을 극대화하기 위한 광범위한 테스트와 평가를 거쳤다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 앤트로픽




앤트로픽, 코딩 성능 뛰어난 클로드 4 출시… 개발자 워크플로우 통합 강화 – AI 매터스 l AI Matters