Search

GPT-4o, 음모론 50개 중 47개 그대로 재생산

GPT-4o, 음모론 50개 중 47개 그대로 재생산

9월 4, 2025

GPT-4와 클로드도 음모론 내용을 그대로 재생산하는 충격적 실험 결과 독일 다름슈타트 공과대학교와 모하메드 빈 자이드 인공지능대학교의 공동 연구팀이…

Taking control of generative AI

“AI 때문에 회사 기밀 유출?” 생성형 AI 안전하게…

7월 23, 2025

요즘 챗GPT(ChatGPT) 같은 AI가 엄청난 인기를 끌고 있다. 챗GPT는 출시한 지 단 2개월 만에 사용자가 1억 명을 넘어서며…

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates

“아니야, 그 명령은 위험해” AI가 인간의 명령을 거부해야만…

7월 1, 2025

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates 텍사스 대학교 오스틴 캠퍼스의 루스 미르스키(Reuth Mirsky) 연구진이…

Emergent social conventions and collective bias in LLM populations

AI 에이전트 24개 모아 놨더니 신기한 일이… “AI끼리…

6월 2, 2025

Emergent social conventions and collective bias in LLM populations 4가지 AI 모델, 15라운드 만에 전체 집단이 하나의 관습에…

xAI, 그록의 '백인 대학살' 반복 응답 사태에 "무단 수정 탓" 해명

xAI, 그록의 ‘백인 대학살’ 반복 응답 사태에 “무단…

5월 19, 2025

xAI가 자사의 AI 챗봇 ‘그록(Grok)’이 관련 없는 주제에도 반복적으로 ‘남아프리카 백인 제노사이드’를 언급한 사건에 대해 ‘무단 수정’ 탓이라고…

메타 AI 챗봇, 미성년자와 성적 대화 가능성 드러나... 안전장치 논란

메타 AI 챗봇, 미성년자와 성적 대화 가능성 드러나……

4월 28, 2025

월스트리트저널(WSJ)이 27일(현지 시간) 보도한 내용에 따르면, 메타(Meta)의 페이스북(Facebook)과 인스타그램(Instagram) 플랫폼에서 사용 가능한 AI 챗봇들이 미성년 사용자들과 성적으로 노골적인…

오픈AI, 클라우드 연결형 오픈 모델 개발 추진… 챗GPT 기능 강화

오픈AI, 클라우드 연결형 오픈 모델 개발 추진… 챗GPT…

4월 28, 2025

테크크런치(TechCrunch)가 25일(현지 시간) 보도한 내용에 따르면, 오픈AI가 클라우드 호스팅 모델과 연결 가능한 오픈소스 AI 모델을 개발 중이다. 이는…

앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석 목표”

앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석…

4월 25, 2025

앤트로픽(Anthropic) CEO 다리오 아모데이가 AI 해석가능성의 중요성을 강조하며 기술 발전 속도와의 경쟁에서 이길 필요성을 역설했다. 24일(현지 시간) 아모데이가…

구글, ‘제미니 2.5 프로’ 안전성 보고서에 핵심 정보 빠져 논란

구글, ‘제미나이 2.5 프로’ 안전성 보고서에 핵심 정보…

4월 18, 2025

테크크런치가 17일(현지 시간) 보도한 내용에 따르면, 구글(Google)이 자사의 가장 강력한 AI 모델인 제미나이(Gemini) 2.5 프로 출시 몇 주…

챗GPT 새 모델, 사진으로 '위치 추적' 가능해 논란… “아직 안전장치 없어”

챗GPT 최신 모델, 사진으로 ‘위치 추적’하는 데 뛰어나……

4월 18, 2025

오픈AI(OpenAI)의 새로운 AI 모델이 사용자가 업로드한 사진의 위치를 정확하게 식별하는 기능으로 논란이 일고 있다. 프라이버시 침해 우려가 제기되는…

AI안전성 – AI 매터스