AGI(범용 인공지능)가 정확히 무엇인지에 대한 명확한 정의가 없어, AI 기술이 얼마나 발전했는지 제대로 평가하기 어렵다는 문제가 있었다. 미국 AI 안전센터(Center for AI Safety), UC버클리,…
앤트로픽(Anthropic)이 현존하는 코딩 모델 중 가장 강력한 성능을 자랑하는 ‘클로드 소넷 4.5(Claude Sonnet 4.5)’를 29일(현지 시각) 공개했다. 앤트로픽에 따르면 클로드 소넷 4.5는 실제 소프트웨어…
구글의 생성형 AI 모델 제미나이(Gemini) 2.5 딥씽크(Deep Think)가 2025년 국제대학생프로그래밍경진대회(ICPC) 세계 결선에서 금메달급 성과를 거뒀다고 구글이 17일(현지 시각) 발표했다. 구글 키워드(The Keyword) 블로그에 따르면,…
오픈AI(OpenAI)의 수석 과학자 야쿠브 파호츠키(Jakub Pachocki)가 인공지능이 과학 연구를 자동화하는 시대가 곧 올 것이라고 전망했다고 15일(현지 시간) 오픈AI 팟캐스트에서 밝혔다. 파호츠키는 “매우 유능한 연구자와…
오픈AI의 추론 시스템이 세계 최고 수준의 프로그래밍 대회인 2025년 국제정보올림피아드(International Olympiad in Informatics, IOI)에서 금메달을 획득했다고 12일(현지 시간) 발표했다. 오픈AI 연구원 셰릴 수(Sheryl Hsu)는…
오픈AI(OpenAI)가 범용 추론 시스템으로 2025년 국제수학올림피아드(IMO) 금메달 수준의 성과를 달성했다고 발표했다. 샘 알트만(Sam Altman) 오픈AI 최고경영자(CEO)는 19일(현지 시간) 자신의 엑스(X) 계정을 통해 “범용 추론…
오픈AI(OpenAI)가 오픈소스 모델 출시를 또 다시 연기했다. 이번 여름 이미 한 달 미뤄진 바 있던 출시 일정이 이번에는 무기한 연기됐다. 테크크런치가 11일(현지 시간) 보도한…
Online Difficulty Filtering for Reasoning Oriented Reinforcement Learning AI가 수학 문제를 잘 풀 수 있게 훈련시키려면 어떤 문제를 주는 것이 좋을까? 네이버 클라우드(NAVER Cloud)와…
R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution 연구자 AI + 개발자 AI = 완벽한 팀워크, o1과 GPT-4.1 조합으로…
Sufficient Context: A New Lens on Retrieval Augmented Generation Systems 표준 데이터셋의 55.4%가 불완전한 정보: ‘충분한 맥락’ 개념으로 드러난 AI 한계 검색 증강 생성(RAG)…
테크크런치가 25일(현지 시간) 보도한 내용에 따르면, A앤트로픽(Anthropic)의 인공지능 비서 ‘클로드(Claude)’가 포켓몬 레드 게임에 도전하고 있다. 느린 속도로 진행되지만, 현대 AI 기술의 능력과 이에 대한…
구글 딥마인드가 대규모 언어 모델(Large Language Models, LLM)을 활용한 혁신적인 AI 에이전트 아키텍처를 공개했다. ‘토커-리즈너(Talker-Reasoner)’ 구조로 명명된 이 시스템은 노벨 경제학상 수상자 대니얼 카너먼의…
현대 수학의 증명이 점점 복잡해지면서 동료 평가 과정에서도 오류를 발견하기 어려워지고 있다. 이러한 문제를 해결하기 위해 린(Lean), 이자벨(Isabelle), 코크(Coq) 등의 형식 수학 언어가 개발됐지만,…