SWEbench

구글 vs 앤트로픽, AI 벤치마크 경쟁 ‘포켓몬’까지 확산... "공정한 비교가 가능할까?"

구글 vs 앤트로픽, AI 벤치마크 경쟁 ‘포켓몬’까지 확산……

4월 15, 2025

구글(Google)의 제미나이(Gemini)와 앤트로픽(Anthropic)의 클로드(Claude) AI 모델이 포켓몬 게임에서 경쟁하고 있다. 이처럼 AI 벤치마킹 논쟁은 이제 게임 세계까지 확장됐다.…

오픈AI, GPT-4.1 신규 모델 출시… 코딩 성능 및 지시 수행 능력 대폭 향상

오픈AI, GPT-4.1 신규 모델 출시… 코딩 성능 및…

4월 15, 2025

오픈AI가 14일(현지 시간) 코딩 성능과 지시 수행 능력이 크게 향상된 새로운 AI 모델 시리즈인 GPT-4.1을 API를 통해 출시했다.…

SWEbench – AI 매터스