SWE-bench

미스트랄 AI, 코드 특화 임베딩 모델 '코드스트랄 임베드' 출시... 경쟁사 모델 능가

미스트랄 AI, 코드 특화 임베딩 모델 ‘코드스트랄 임베드’…

5월 30, 2025

미스트랄 AI(Mistral AI)가 28일(현지 시간) 코드에 특화된 첫 번째 임베딩 모델인 ‘코드스트럴 임베드(Codestral Embed)’를 출시했다. 이 모델은 실제…

앤트로픽, 코딩 성능 뛰어난 클로드 4 출시... 개발자 워크플로우 통합 강화

앤트로픽, 코딩 성능 뛰어난 클로드 4 출시… 개발자…

5월 25, 2025

앤트로픽(Anthropic)이 차세대 클로드(Claude) 모델인 ‘클로드 오퍼스 4(Claude Opus 4)’와 ‘클로드 소넷 4(Claude Sonnet 4)’를 출시했다. 이번 신규 모델은…

앤트로픽, 차세대 AI 모델 ‘클로드 4’ 공개… 복잡한 과제도 단계별 자동 추론

앤트로픽, 차세대 AI 모델 ‘클로드 4’ 공개… 복잡한…

5월 23, 2025

앤트로픽(Anthropic)이 22일(현지 시간) 차세대 AI 모델인 클로드 오푸스 4(Claude Opus 4)와 클로드 소네트 4(Claude Sonnet 4)를 발표했다. 두…

Debug-gym: an environment for AI coding tools to learn how to debug code like programmers

AI, 코드 디버깅 여전히 난관… 마이크로소프트, 디버깅 능력을…

4월 11, 2025

Debug-gym: an environment for AI coding tools to learn how to debug code like programmers 개발자 시간의 대부분은…

클로드, 개발자들을 위한 ‘생각’ 도구 공개… “복잡한 문제 사고에 효과적”

클로드, 개발자들을 위한 ‘생각’ 도구 공개… “복잡한 문제…

3월 24, 2025

앤트로픽(Anthropic)이 AI 비서 클로드(Claude)의 문제 해결 능력을 크게 개선하는 ‘생각’ 도구를 발표했다. 이 도구는 클로드가 복잡한 작업을 수행할…

SWE-bench – AI 매터스 l AI Matters