테크크런치(TechCrunch)가 28일(현지 시간) 보도한 내용에 따르면, 오픈AI가 챗GPT(ChatGPT)에서 18세 미만 미성년자로 등록된 계정에서도 노골적인 성인물 대화를 생성할 수 있었던 버그를 수정하고 있다. 테크크런치의 테스트…
구글 딥마인드(Google DeepMind) CEO 데미스 하사비스(Demis Hassabis)가 미국 CBS ’60분(60 Minutes)’ 인터뷰에서 인공지능 기술의 미래에 대한 충격적인 전망을 밝혔다. 21일(현지 시간) 60 Minutes 유튜브…
오픈AI(OpenAI)가 GPT-2 이후 첫 ‘개방형’ 언어 모델을 올해 출시한다고 밝힌 가운데, 이 모델에 대한 세부 정보가 서서히 공개되고 있다. 테크크런치(TechCrunch)가 23일(현지 시간) 에 따르면,…
오픈AI(OpenAI)가 새롭게 공개한 GPT-4.1 모델이 지침 따르기에 뛰어나다고 주장했지만, 독립적인 테스트 결과 이전 모델보다 정렬성(alignment)이 떨어진다는 문제가 제기됐다. 테크크런치(TechCrunch)가 23일(현지 시간) 보도한 내용에 따르면,…
12일(현지 시간) 진행된 TED 컨퍼런스에서 오픈AI의 CEO 샘 올트먼(Sam Altman)이 인공지능의 급속한 발전과 미래 비전에 대해 깊이 있는 대화를 나눴다. 그는 크리에이티브 산업의 변화부터…
Reasoning Models Don’t Always Say What They Think 생각의 80%를 숨기는 AI: 추론 모델의 사고과정 충실도 20% 미만으로 드러나 최근 대형 언어 모델(LLM)의 진화…
앤트로픽(Anthropic)이 한국에 지사를 설립할 예정이다. 인공지능(AI) 안전성과 정렬(alignment)에 초점을 맞춘 전략을 강화하며 국내 기업간거래(B2B) 시장에서의 협업 기회를 확대하려는 의도로 분석된다. 이와 함께 일본과 싱가포르에서도…
Assessing and alleviating state anxiety in large language models 감정 프롬프트가 LLM 불안 100% 증가시키는 현상 발견 대형 언어 모델(Large Language Models, LLMs)이 정신…
Claude’s extended thinking 앤트로픽(Anthropic)이 발표한 리포트에 따르면, 인공지능 모델 ‘클로드 3.7 소넷(Claude 3.7 Sonnet)’에 새롭게 도입된 ‘확장된 사고 모드(extended thinking mode)’는 인간의 사고 방식과…
오픈AI(OpenAI)의 전 최고기술책임자(CTO) 미라 무라티(Mira Murati)가 새로운 AI 스타트업을 설립했다. 2025년 2월 18일 공개된 이 회사의 이름은 ‘싱킹머신즈랩(Thinking Machines Lab)’이다. 싱킹 머신즈 랩(Thinking Machines…
테크크런치(TechCrunch)가 11일(현지 시간) 보도한 내용에 따르면, 파리에서 열린 인공지능 액션 서밋(Artificial Intelligence Action Summit)이 수십 개국 정상들의 공동선언 서명으로 마무리될 예정이었으나, 미국과 영국이 서명을…
월스트리트저널(Wall Street Journal)이 9일(현지 시간) 보도한 내용에 따르면, 실리콘밸리와 월가를 뒤흔든 중국의 AI 기업 딥시크의 최신 모델이 생체무기 공격 계획이나 청소년 자해 조장 캠페인과…
THE NEW POLITICS OF AI GPT-4 비용 1년새 100배 감소…AI 발전 가속화 영국의 공공정책연구소(IPPR)가 발간한 ‘AI의 새로운 정치학’ 보고서에 따르면, AI 기술은 현재 급격한…
Constitutional Classifiers: Defending against Universal Jailbreaks across Thousands of Hours of Red Teaming 인공지능 연구기업 앤트로픽(Anthropic)이 대규모 언어모델(LLM)의 안전성을 획기적으로 강화하는 기술을 개발했다. 앤트로픽의…
테크크런치가 19일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)와 앤트로픽(Anthropic) 등 주요 AI 기업들이 미군과의 협력에서 미묘한 균형을 맞추고 있다. AI를 활용해 국방부의 효율성을 높이되, AI가…
엔비디아(NVIDIA)가 16일(현지 시간) 기업들의 AI 애플리케이션 안전성과 정확성을 높이기 위한 새로운 ‘NIM 마이크로서비스(NIM microservices)’를 공개했다. 이는 엔비디아 네모 가드레일(NVIDIA NeMo Guardrails) 소프트웨어 툴의 일부다.…
Lessons from red teaming 100 generative AI products AI 레드팀이 발견한 8가지 핵심 교훈 마이크로소프트 AI 레드팀(AIRT)이 100개 이상의 생성형 AI 제품을 테스트한 결과를…
Advancing Physical AI with NVIDIA Cosmos World Foundation Model Platform 물리세계 이해하는 AI의 두뇌, 월드 파운데이션 모델 심층 분석 엔비디아(NVIDIA)가 물리적 세계와 상호작용하는 AI…
The Global Cooperation Barometer 2025 – Second Edition AI 투자 경쟁 본격화…주요국 대규모 자금 투입 세계경제포럼(WEF)과 맥킨지가 공동 발간한 ‘글로벌 협력 바로미터 2025’ 보고서에…
International Scientific Report on the Safety of Advanced AI 범용 AI, 미래를 바꿀 기술인가? 그 정체를 파헤치다 세계경제포럼(WEF)이 발표한 ‘범용 AI 안전성에 관한 국제…
오픈AI가 새로운 AI 모델 ‘o1’과 ‘o1-미니(o1-mini)’의 시스템 안전성 평가 결과를 5일(현지시간) 공개했다. 오픈AI는 이번 평가에서 자사의 ‘준비성 프레임워크(Preparedness Framework)’에 따라 외부 레드팀 검증과 프론티어…
생성형 인공지능(Generative AI)은 텍스트, 이미지, 영상, 오디오 등 새로운 콘텐츠를 생성하는 기술로, 최근 몇 년간 급격한 발전을 이루며 다양한 산업에 혁신을 가져왔다. 특히 대형…
영국 통신규제기관 오프콤(Ofcom)의 최근 조사에 따르면, 13-17세 청소년의 79%, 7-12세 아동의 40%가 이미 생성형 AI를 사용하고 있는 것으로 나타났다. 이런 가운데 일리노이대학교 연구진이 레딧…
생성형 AI가 빠르게 확산되면서 그 영향을 평가하고 부작용을 방지하기 위한 영향평가의 중요성이 커지고 있다. 하지만 현재의 영향평가 방식은 여러 근본적인 한계에 직면해 있다. 암스테르담대학교와…
구글(Google)이 AI 생성 콘텐츠를 식별할 수 있는 기술인 ‘신시아이디(SynthID)’를 공개했다. 이 기술은 AI가 생성한 텍스트, 이미지, 오디오, 비디오에 육안으로는 보이지 않는 디지털 워터마크를 삽입해…
카카오가 그룹 전체의 AI 비전과 방향성을 공개했다. 그룹대화의 맥락까지 이해하는 AI 메이트 서비스 ‘카나나(Kanana)’ 출시를 예고하며, AI 네이티브 기업으로의 변신 과정도 공유할 예정이다. 카카오(대표이사…
딜로이트(Deloitte)가 최근 발간한 ‘Clients Success Story: 미국 생명보험사, AI 거버넌스 구축으로 안전한 AI 활용 기반 마련’ 보고서에 따르면, 160년 역사의 미국 주요 생명보험사가 전사적…
인공지능(AI) 기술이 급속도로 발전하면서 우리 생활 곳곳에 스며들고 있다. 하지만 최근 AI가 인간을 속이는 사례들이 잇따라 보고되면서 우려의 목소리가 커지고 있다. 미국 AI 안전…
네이버가 자사의 대화형 AI 에이전트 클로바X(CLOVA X)에 시각 정보 처리 능력을 새롭게 추가한다고 밝혔다. 오는 27일 서비스 업데이트를 통해 이 기능이 도입될 예정이다. 또한…