테크크런치가 25일(현지 시간) 보도한 내용에 따르면, A앤트로픽(Anthropic)의 인공지능 비서 ‘클로드(Claude)’가 포켓몬 레드 게임에 도전하고 있다. 느린 속도로 진행되지만, 현대 AI 기술의 능력과 이에 대한 사람들의 반응을 보여주는 흥미로운 실험이 되고 있다. 24일 오후(현지 시간), 앤트로픽은 자사의 최신 AI 모델인 ‘클로드 3.7 소넷(Claude 3.7 Sonnet)’이 포켓몬 레드 게임을 플레이하는 모습을 트위치(Twitch)에서 생중계하는 ‘클로드 플레이스 포켓몬(Claude Plays Pokémon)’을 시작했다.
테크크런치(TechCrunch)에 따르면, AI 연구자들은 스트리트 파이터부터 픽셔너리까지 다양한 비디오 게임을 활용해 새로운 모델을 테스트해왔다. 이는 대개 실용성보다는 재미를 위한 경우가 많았다. 그러나 앤트로픽은 포켓몬이 클로드 3.7 소넷의 유용한 벤치마크가 되었다고 밝혔다. 이 모델은 게임에 포함된 퍼즐 유형을 효과적으로 ‘생각’할 수 있다.
오픈AI(OpenAI)의 o3-미니와 딥시크(DeepSeek)의 R1처럼, 클로드 3.7 소넷도 어린이용으로 설계된 비디오 게임 플레이와 같은 어려운 과제를 ‘추론’할 수 있다. 이전 모델인 클로드 3.5 소넷이 포켓몬 레드의 초반부—팔레트 타운의 플레이어 집에서 나가는 것—에서 실패한 반면, 클로드 3.7 소넷은 체육관 리더 배지 세 개를 획득하는 성과를 이뤘다.
하지만 최신 클로드도 여전히 문제에 부딪친다. 트위치 방송 몇 시간 후, 모델은 바위 벽에 막혀 얼마나 시도해도 통과할 수 없었다. 한 트위치 사용자는 이 상황을 이렇게 요약했다: “누가 이길까, 수천 시간의 프로그래밍이 투입된 컴퓨터 AI, 아니면 바위 벽 하나?” 결국 클로드는 벽을 우회할 수 있다는 것을 깨달았다.
느린동이처럼 포켓몬 레드를 탐색하는 클로드를 보는 것은 답답한 면이 있다. 모든 단계를 고통스러울 정도로 신중하게 추론하기 때문이다. 그럼에도 불구하고 묘하게 매력적이다. 화면 왼쪽에는 클로드의 ‘사고 과정’이, 오른쪽에는 실시간 게임플레이가 표시된다. 한 시점에서 클로드는 오크 박사를 연구실 내에서 찾으려 했지만, 현장에 다른 NPC들이 있어 혼란스러워했다. “내 아래에 새로운 캐릭터가 나타났다—좌표 (2, 10)에 검은 머리와 흰색 코트를 입은 것처럼 보이는 캐릭터. 이게 오크 박사일 수도 있다! 내려가서 그와 대화해보자,” 클로드가 작성했다.
이후 클로드는 실수로 오크 박사가 아닌 다른 NPC—모델이 이전에 여러 번 대화했던 NPC—와 대화를 시작했다. 트위치 채팅에 있던 약 1,000명의 시청자 중 일부는 초조해하기 시작했다. 그러나 방송을 몇 분 이상 지켜본 다른 이들은 덜 걱정했다. “여러분 진정해요,” 한 사람이 채팅에 썼다. “전에도 오크 박사 연구실을 10번 정도 들락날락하면서 어떻게 진행해야 할지 이해했었어요.”
앤트로픽은 “Claude Plays Pokémon은 계속해서 연구원의 개인 프로젝트로 진행될 것”이라며 트위치 링크를 공유했다. 이번 프로젝트는 단순한 게임 플레이를 넘어 클로드의 향상된 추론 능력을 보여주는 사례로 주목받고 있다.
해당 기사의 원문은 링크에서 확인할 수 있다.
이미지 출처: 앤트로픽
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
관련 콘텐츠 더보기