앤트로픽의 클로드 3.7 소넷, 예상보다 훨씬 적은 비용으로 학습됐다

앤트로픽(Anthropic)의 최신 주력 AI 모델인 클로드 3.7 소넷(Claude 3.7 Sonnet)이 10의 26승 FLOP 미만의 컴퓨팅 파워를 사용하여 “수천만 달러” 정도의 비용으로 학습됐다고 밝혀졌다.

테크크런치가 25일(현지 시간) 보도한 내용에 따르면, 이는 월튼 대학교의 이단 몰릭(Ethan Mollick) 교수가 월요일 X(구 트위터) 게시물을 통해 앤트로픽 PR팀으로부터 받은 설명을 전달한 내용이다. 몰릭 교수는 “앤트로픽 측에서 연락해 소넷 3.7은 10의 26승 FLOP 모델로 간주되지 않으며 수천만 달러의 비용이 들었다고 알려왔다”며 “다만 향후 모델들은 훨씬 더 커질 것”이라고 전했다.

클로드 3.7 소넷이 실제로 관련 비용을 제외하고 “수천만 달러”만 들었다면, 이는 최첨단 모델을 출시하는 데 드는 비용이 상대적으로 저렴해지고 있음을 보여주는 신호다. 소넷의 전임자인 클로드 3.5 역시 2024년 가을 출시됐을 때 수천만 달러의 학습 비용이 들었다고 앤트로픽의 CEO 다리오 아모데이(Dario Amodei)가 최근 에세이에서 밝힌 바 있다.

이러한 총액은 2023년 최고 모델들의 학습 비용과 비교했을 때 상당히 유리하다. GPT-4 모델을 개발하기 위해 오픈AI(OpenAI)는 오픈AI CEO 샘 알트만(Sam Altman)에 따르면 1억 달러 이상을 지출했다. 한편 구글(Google)은 제미니 울트라(Gemini Ultra) 모델을 학습시키는 데 스탠포드 연구에 따르면 약 2억 달러를 지출했다.

물론 학습 비용만으로는 안전성 테스트나 기초 연구와 같은 작업을 포착할 수 없다. 더욱이 AI 업계가 문제를 오랜 시간 작업하는 “추론” 모델을 채택함에 따라 모델 운영 컴퓨팅 비용은 계속 증가할 가능성이 높다. 앤트로픽의 이번 발표는 AI 기술이 점점 더 효율적으로 발전하고 있음을 보여주는 사례로, 향후 AI 산업이 어떻게 발전해 나갈지 귀추가 주목된다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 앤트로픽

기사는 클로드와 챗GPT를 활용해 작성되었습니다.