Self-Adapting Language Models MIT 연구진이 발표한 논문에 따르면, 대형 언어모델(LLM)은 강력한 성능을 보이지만 한 가지 치명적인 약점이 있다.…
Enhancing Creative Generation on Stable Diffusion-based Models KAIST와 네이버 AI랩의 연구진이 Stable Diffusion 기반 모델의 창의적 이미지 생성…
앤트로픽(Anthropic)의 생성형 AI 모델 클로드(Claude)가 11일(현지 시간) 미국 연방정부 최고 보안 등급 업무에서 사용 승인을 받았다. 아마존 베드록(Amazon…
메타(Meta)가 데이터 라벨링 회사 스케일AI(Scale AI)에 약 150억 달러를 투자해 49% 지분을 확보하고, 알렉산드르 왕(Alexandr Wang) 최고경영자를 영입해…
Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models 오픈AI o1·딥시크 R1도 겪는 ‘아하!’ 순간의 예측 불가능성…
테크크런치가 29일(현지 시간) 보도한 내용에 따르면, 중국 AI 스타트업 딥시크(DeepSeek)의 최신 AI 모델인 업데이트된 R1 추론 모델이 코딩,…
중국 인터넷 대기업 바이두(Baidu)가 치열한 AI 경쟁에서 두각을 나타내기 위해 두 가지 새로운 인공지능 모델을 출시했다. 특히 그중…
인셉션 랩스(Inception Labs)가 지난달 27일(현지 시간) 자사 웹사이트를 통해 세계 최초의 상업용 디퓨전 대규모 언어 모델(dLLM) ‘머큐리(Mercury)’를 공개했다.…
Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling 테스트 시간 확장이 작은 언어 모델의 성능을 비약적으로…
오픈AI가 자사 공식 X를 통해 AI 모델의 사고 과정(Chain of Thought, CoT) 기능을 업데이트했다. 이번 업데이트는 무료·유료 사용자용…