마이크로소프트(Microsoft)가 19일(현지 시간) 자사 블로그를 통해 게임 시각화와 컨트롤러 동작을 생성할 수 있는 세계 최초의 월드 앤 휴먼 액션 모델(WHAM)인 ‘뮤즈(Muse)’를 공개했다.
네이처(Nature)지에 따르면, 뮤즈는 마이크로소프트 리서치 게임 인텔리전스(Microsoft Research Game Intelligence)와 티처블 AI 익스피리언스(Teachable AI Experiences) 팀이 엑스박스 게임 스튜디오의 닌자 시오리(Ninja Theory)와 협력하여 개발했다. 이 모델은 게임 비주얼과 컨트롤러 동작을 모두 생성할 수 있으며, 연구자들의 실험을 돕기 위해 모델 가중치와 샘플 데이터를 오픈소스로 공개했다. 개발자들은 애저 AI 파운드리(Azure AI Foundry)를 통해 WHAM 데모를 실행하고 실험할 수 있다.

뮤즈는 엑스박스 게임 ‘블리딩 엣지(Bleeding Edge)’의 게임플레이 데이터를 기반으로 학습됐다. 현재 버전의 뮤즈는 10억 개 이상의 이미지와 컨트롤러 동작 데이터를 학습했으며, 이는 7년 이상의 연속적인 게임플레이 시간에 해당한다.
뮤즈의 성능은 세 가지 핵심 능력을 기준으로 평가된다:
- 일관성(Consistency): 게임 역학을 존중하는 게임플레이 시퀀스 생성 능력
- 다양성(Diversity): 동일한 초기 프롬프트로 다양한 게임플레이 변형 생성 능력
- 지속성(Persistency): 사용자가 수정한 내용을 게임플레이 시퀀스에 반영하는 능력
카차 호프만(Katja Hofmann) 마이크로소프트 리서치 게임 인텔리전스 팀 수석 연구 관리자는 “이번 연구를 통해 게임 크리에이터들이 생성형 AI 모델을 창의적으로 활용할 수 있는 새로운 가능성을 제시했다”고 말했다. 마이크로소프트는 뮤즈가 게임플레이 아이디어 발상을 지원하고, AI 기반의 새로운 게임 경험을 제공하는 데 기여할 것으로 기대하고 있다.
해당 기사 원문은 링크에서 확인할 수 있다.
이미지 출처: 마이크로소프트
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
관련 콘텐츠 더보기