AI 모델 성능 - AI매터스

AI 모델 성능

구글, '나노 바나나 2 플래시' 출시 임박… 더 저렴한 비용에 프로급 성능

구글, ‘나노 바나나 2 플래시’ 출시 임박… 더 저렴한 비용에 프로급 성능

12월 8, 2025

구글이 제미나이 내에 새로운 인공지능(AI) 모델 ‘나노 바나나 2 플래시(Nano Banana 2 Flash)’를 출시할 준비를 마친 것으로 확인됐다. 이 모델은 프로(Pro) 버전과 유사한 성능을…

xAI, ‘그록 4 패스트' 공개… ‘속도·비용·성능 극대화’

xAI, ‘그록 4 패스트’ 공개… ‘속도·비용·성능 극대화’

9월 22, 2025

일론 머스크가 이끄는 인공지능(AI) 스타트업 xAI가 비용 효율성을 극대화한 새로운 AI 모델 ‘그록 4 패스트’를 공개했다. 이 모델은 기존 그록 4와 비슷한 성능을 유지하면서도…

오픈AI 연구원들 "AI 발전해도 코딩 배우는 것 포기하면 안 돼”.

오픈AI 연구원들 “AI 발전해도 코딩 배우는 것 포기하면 안 돼”

8월 19, 2025

오픈AI(OpenAI)의 수석 과학자 야쿠브 파호츠키(Jakub Pachocki)가 인공지능이 과학 연구를 자동화하는 시대가 곧 올 것이라고 전망했다고 15일(현지 시간) 오픈AI 팟캐스트에서 밝혔다. 파호츠키는 “매우 유능한 연구자와…

일론 머스크는 왜 자꾸 싸우려고 할까(vs. 애플·오픈AI)

일론 머스크는 왜 자꾸 싸우려고 할까(vs. 애플·오픈AI)

8월 19, 2025

일론 머스크가 100억 8,345회차 논란의 중심에 섰습니다. 이번엔 애플과 오픈AI를 상대로 한 반독점 소송 위협입니다. 사건의 발단과 배경 – 그록 4 무료화라는 전략적 행보…

오픈AI, 세계 최고 프로그래밍 대회서 금메달 획득… AI 참가자 중 1위

오픈AI, 세계 최고 프로그래밍 대회서 금메달 획득… AI 중 1위, 인간 5명에겐 패배

8월 12, 2025

오픈AI의 추론 시스템이 세계 최고 수준의 프로그래밍 대회인 2025년 국제정보올림피아드(International Olympiad in Informatics, IOI)에서 금메달을 획득했다고 12일(현지 시간) 발표했다. 오픈AI 연구원 셰릴 수(Sheryl Hsu)는…

Self-Adapting Language Models

“이제 AI가 스스로 공부한다” MIT, 인간 없이 스스로 학습하는 AI 언어 모델 개발

6월 25, 2025

Self-Adapting Language Models MIT 연구진이 발표한 논문에 따르면, 대형 언어모델(LLM)은 강력한 성능을 보이지만 한 가지 치명적인 약점이 있다. 새로운 작업이나 지식, 예시에 대응하여 가중치를…

Enhancing Creative Generation on Stable Diffusion-based Models

평범한 이미지 그리는 AI 그만… KAIST 개발 ‘진짜’ 창의적 이미지 생성 모델

6월 24, 2025

Enhancing Creative Generation on Stable Diffusion-based Models KAIST와 네이버 AI랩의 연구진이 Stable Diffusion 기반 모델의 창의적 이미지 생성 능력을 획기적으로 향상시키는 새로운 기법을 개발했다.…

앤트로픽 클로드, 美 정부 최고 보안 등급 업무 승인받아

앤트로픽 클로드, 美 정부 최고 보안 등급 업무에 투입된다

6월 12, 2025

앤트로픽(Anthropic)의 생성형 AI 모델 클로드(Claude)가 11일(현지 시간) 미국 연방정부 최고 보안 등급 업무에서 사용 승인을 받았다. 아마존 베드록(Amazon Bedrock)을 통해 연방위험 및 승인 관리…

메타, 스케일AI에 150억 달러 투자로 49% 지분 확보… AI 경쟁 재점화 시도

메타, 150억 달러로 스케일AI에 지분 49% 확보… AI 경쟁 다시 뛰어든다

6월 12, 2025

메타(Meta)가 데이터 라벨링 회사 스케일AI(Scale AI)에 약 150억 달러를 투자해 49% 지분을 확보하고, 알렉산드르 왕(Alexandr Wang) 최고경영자를 영입해 새로운 ‘초지능’ 연구소를 이끌도록 했다고 보도됐다.…

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

‘번뜩’ 하는 순간에 의존하던 AI, 드디어 체계적으로 생각하는 법을 배웠다! 수학·코딩 성능 10% 급상승의 비밀

5월 30, 2025

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models 오픈AI o1·딥시크 R1도 겪는 ‘아하!’ 순간의 예측 불가능성 문제 세일즈 포스 AI 연구소 및…

딥시크, R1 AI 모델 성능 강화… 중국 정부 비판엔 ‘검열’ 강해져

딥시크, R1 AI 모델 성능 강화… 중국 정부 비판엔 ‘검열’ 강해져

5월 30, 2025

테크크런치가 29일(현지 시간) 보도한 내용에 따르면, 중국 AI 스타트업 딥시크(DeepSeek)의 최신 AI 모델인 업데이트된 R1 추론 모델이 코딩, 수학, 일반 지식 벤치마크에서 인상적인 점수를…

바이두, 추론-멀티모달 2가지 AI 모델 출시… 딥시크 성능에 가격은 반

바이두, 추론-멀티모달 2가지 AI 모델 출시… 딥시크 성능에 가격은 반

3월 17, 2025

중국 인터넷 대기업 바이두(Baidu)가 치열한 AI 경쟁에서 두각을 나타내기 위해 두 가지 새로운 인공지능 모델을 출시했다. 특히 그중 하나는 추론에 중점을 둔 모델로, 중국…

인셉션, 세계 최초 상업용 디퓨전 LLM ‘머큐리’ 공개… “기존 LLM보다 10배 빠르다”

인셉션, 세계 최초 상업용 디퓨전 LLM ‘머큐리’ 공개… “기존 LLM보다 10배 빠르다”

3월 12, 2025

인셉션 랩스(Inception Labs)가 지난달 27일(현지 시간) 자사 웹사이트를 통해 세계 최초의 상업용 디퓨전 대규모 언어 모델(dLLM) ‘머큐리(Mercury)’를 공개했다. 이 새로운 모델은 기존 LLM보다 최대…

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

1B 모델의 반란: 테스트 시간 확장으로 405B 대형 언어 모델 능가

2월 25, 2025

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling 테스트 시간 확장이 작은 언어 모델의 성능을 비약적으로 향상 테스트 시간 확장(Test-Time Scaling, TTS)은…

오픈AI, ‘o3-미니' 추론 과정 일부 공개… 딥시크 의식하나

오픈AI, ‘o3-미니’ 추론 과정 일부 공개… 딥시크 의식하나

2월 10, 2025

오픈AI가 자사 공식 X를 통해 AI 모델의 사고 과정(Chain of Thought, CoT) 기능을 업데이트했다. 이번 업데이트는 무료·유료 사용자용 O3-미니(o3-mini)와 유료 사용자 전용 O3-미니-하이(o3-mini-high) 모델에…

ScribblePrompt: Fast and Flexible Interactive Segmentation for Any Biomedical Image

의료 영상 분석을 위한 혁신적 AI 도구 ‘ScribblePrompt’ 개발

9월 13, 2024

의료 영상 분석 분야에서 인공지능(AI) 기술이 새로운 지평을 열고 있다. 최근 매사추세츠 공과대학(MIT)과 매사추세츠 종합병원(MGH) 연구진이 개발한 ‘ScribblePrompt’는 의료 영상 분할 작업을 빠르고 정확하게…

1
2
3

Trending

엔비디아, AI 에이전트용 모델 '네모트론 3 슈퍼' 공개…속도 5배↑ 비용은 줄였다

엔비디아, AI 에이전트용 모델 ‘네모트론 3 슈퍼’…

이시안 에디터 3월 12, 2026

"엔비디아 없어도 돼"…메타(Meta), 2년 안에 자체 AI 칩 4종 쏟아낸다

“엔비디아 없어도 돼”…메타(Meta), 2년 안에 자체 AI…

이시안 에디터 3월 13, 2026

“자비스가 내 손 안에”…오픈클로 파생 상품 5종 총정리, 당신에게 맞는 가재는 누구일까?

[AI 매터스 뉴스레터 #171] “자비스가 내 손 안에”…오픈클로…

이시안 에디터 3월 13, 2026