Search

오픈AI-앤트로픽, 경쟁사 AI 모델로 서로 안전성 테스트… 업계 첫 협력 사례

오픈AI-앤트로픽, 경쟁사 AI 모델로 서로 안전성 테스트… 업계…

8월 28, 2025

인공지능(AI) 업계 양대 거물인 오픈AI(OpenAI)와 앤트로픽(Anthropic)이 치열한 경쟁 관계에도 불구하고 서로의 AI 모델을 이용해 안전성 테스트를 실시했다고 테크크런치(TechCrunch)가…

The PacifAIst Benchmark:Would an Artificial Intelligence Choose to Sacrifice Itself for Human Safety?

인류 멸망 위기가 닥치면 어떤 AI가 자기 파괴를…

8월 26, 2025

스페인 하엔 대학교 공과대학의 마누엘 헤라도르 무뇨스 연구팀이 “AI가 인간을 구하기 위해 스스로 희생할 것인가”를 묻는 실험을 진행했다.…

오픈AI 연구원들 "AI 발전해도 코딩 배우는 것 포기하면 안 돼”.

오픈AI 연구원들 “AI 발전해도 코딩 배우는 것 포기하면…

8월 19, 2025

오픈AI(OpenAI)의 수석 과학자 야쿠브 파호츠키(Jakub Pachocki)가 인공지능이 과학 연구를 자동화하는 시대가 곧 올 것이라고 전망했다고 15일(현지 시간) 오픈AI…

"AI가 거짓말하는 순간 포착"... 앤트로픽, 클로드 내부 사고과정 공개

“AI가 거짓말하는 순간 포착”… 앤트로픽, 클로드 내부 사고과정…

8월 19, 2025

생성형 AI가 사용자에게 거짓말을 하면서도 그럴듯한 설명을 덧붙이는 순간이 과학적으로 포착됐다. AI 기업 앤트로픽(Anthropic)이 자사 AI 모델 클로드(Claude)의…

GPT-5, 출시 몇 시간 만에 탈옥 당해… “평범한 대화 속에 나쁜 내용 몰래 넣어”

GPT-5, 출시 몇 시간 만에 탈옥 당해… “평범한…

8월 13, 2025

CSO가 12일(현지 시간) 보도한 내용에 따르면, 오픈AI(OpenAI)의 새 인공지능 GPT-5가 출시된 지 몇 시간 만에 탈옥을 당했다. AI…

Persona Vectors: Monitoring and Controlling Character Traits in Language Models

오락가락하는 챗GPT 성격, 이유 찾았다… 앤트로픽, AI 성격…

8월 4, 2025

챗GPT 같은 대화형 AI가 갑자기 위험한 말을 하거나 이상하게 행동하는 현상을 해결할 수 있는 새로운 방법이 나왔다. 앤트로픽…

"AI의 사고과정 감시 시급하다"… AI 업계 리더들, 공동 입장문 발표

“AI의 사고과정 감시 시급하다”… AI 업계 리더들, 공동…

7월 16, 2025

오픈AI(OpenAI), 구글 딥마인드(Google DeepMind), 앤트로픽(Anthropic) 등 주요 AI 기업과 비영리 단체 연구진들이 AI 추론 모델의 소위 ‘생각’을 감시하는…

앤트로픽, 美 국가보안 기관 전용 '클로드 Gov' 배포

美 정부가 선택할 정도의 보안 성능, 앤트로픽 ‘클로드…

6월 12, 2025

앤트로픽(Anthropic)이 미국 국가보안 고객 전용으로 설계된 맞춤형 클로드 정부 모델(Claude Gov Models)을 출시했다고 6일(현지 시간) 발표했다. 이 모델들은…

Comparing Apples to Oranges: A Taxonomy for Navigating the Global Landscape of AI Regulation

AI 규제 전쟁: EU vs 미국 vs 중국,…

5월 30, 2025

Comparing Apples to Oranges: A Taxonomy for Navigating the Global Landscape of AI Regulation 스탠포드·하버드 연구진이 밝힌 ‘AI…

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

‘번뜩’ 하는 순간에 의존하던 AI, 드디어 체계적으로 생각하는…

5월 30, 2025

Beyond ‘Aha!’: Toward Systematic Meta-Abilities Alignment in Large Reasoning Models 오픈AI o1·딥시크 R1도 겪는 ‘아하!’ 순간의 예측 불가능성…

AI 안전성 – AI 매터스 l AI Matters