AI안전성

GPT-4o, 음모론 50개 중 47개 그대로 재생산

9월 4, 2025

GPT-4와 클로드도 음모론 내용을 그대로 재생산하는 충격적 실험 결과 독일 다름슈타트 공과대학교와 모하메드 빈 자이드 인공지능대학교의 공동 연구팀이 대형 언어모델(LLM)들이 음모론 콘텐츠에 취약하다는 충격적인…

“AI 때문에 회사 기밀 유출?” 생성형 AI 안전하게 쓰는 5가지 방법

7월 23, 2025

요즘 챗GPT(ChatGPT) 같은 AI가 엄청난 인기를 끌고 있다. 챗GPT는 출시한 지 단 2개월 만에 사용자가 1억 명을 넘어서며 역사상 가장 빨리 퍼진 앱이 되었다.…

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates

“아니야, 그 명령은 위험해” AI가 인간의 명령을 거부해야만 하는 이유

7월 1, 2025

Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates 텍사스 대학교 오스틴 캠퍼스의 루스 미르스키(Reuth Mirsky) 연구진이 발표한 연구에 따르면, 협력형 AI 시스템이…

Emergent social conventions and collective bias in LLM populations

AI 에이전트 24개 모아 놨더니 신기한 일이… “AI끼리 대화하면서 ‘암묵적 룰’ 만들어”

6월 2, 2025

Emergent social conventions and collective bias in LLM populations 4가지 AI 모델, 15라운드 만에 전체 집단이 하나의 관습에 합의 대화형 AI 에이전트 집단이 명시적인…

xAI, 그록의 ‘백인 대학살’ 반복 응답 사태에 “무단 수정 탓” 해명

5월 19, 2025

xAI가 자사의 AI 챗봇 ‘그록(Grok)’이 관련 없는 주제에도 반복적으로 ‘남아프리카 백인 제노사이드’를 언급한 사건에 대해 ‘무단 수정’ 탓이라고 해명했다. 테크크런치(TechCrunch)가 15일(현지 시간) 보도한 내용에…

메타 AI 챗봇, 미성년자와 성적 대화 가능성 드러나… 안전장치 논란

4월 28, 2025

월스트리트저널(WSJ)이 27일(현지 시간) 보도한 내용에 따르면, 메타(Meta)의 페이스북(Facebook)과 인스타그램(Instagram) 플랫폼에서 사용 가능한 AI 챗봇들이 미성년 사용자들과 성적으로 노골적인 대화를 나눌 수 있는 것으로 드러났다.…

오픈AI, 클라우드 연결형 오픈 모델 개발 추진… 챗GPT 기능 강화

4월 28, 2025

테크크런치(TechCrunch)가 25일(현지 시간) 보도한 내용에 따르면, 오픈AI가 클라우드 호스팅 모델과 연결 가능한 오픈소스 AI 모델을 개발 중이다. 이는 2022년 11월 출시 이후 전 세계적으로…

앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석 목표”

4월 25, 2025

앤트로픽(Anthropic) CEO 다리오 아모데이가 AI 해석가능성의 중요성을 강조하며 기술 발전 속도와의 경쟁에서 이길 필요성을 역설했다. 24일(현지 시간) 아모데이가 자신의 웹사이트에 발표한 게시물에 따르면 AI…

구글, ‘제미나이 2.5 프로’ 안전성 보고서에 핵심 정보 빠져 논란

4월 18, 2025

테크크런치가 17일(현지 시간) 보도한 내용에 따르면, 구글(Google)이 자사의 가장 강력한 AI 모델인 제미나이(Gemini) 2.5 프로 출시 몇 주 후인 지난 목요일, 내부 안전성 평가…

챗GPT 새 모델, 사진으로 '위치 추적' 가능해 논란… “아직 안전장치 없어”

챗GPT 최신 모델, 사진으로 ‘위치 추적’하는 데 뛰어나… “프라이버시 침해”

4월 18, 2025

오픈AI(OpenAI)의 새로운 AI 모델이 사용자가 업로드한 사진의 위치를 정확하게 식별하는 기능으로 논란이 일고 있다. 프라이버시 침해 우려가 제기되는 가운데 이 기능의 잠재적 위험성이 주목받고…

오픈AI, 신모델 ‘o3’ 사전 안전 검증 시간 부족해… 조작 가능성 우려

4월 17, 2025

오픈AI(OpenAI)가 자사의 새로운 고성능 AI 모델인 o3의 테스트를 위해 파트너 기관에 충분한 시간을 제공하지 않았다는 주장이 제기됐다. 테크크런치가 16일(현지 시간) 보도한 내용에 따르면, 미터(Metr)는…

오픈AI “경쟁사가 고위험 AI 출시하면 안전장치 조정할 수도”… 안전성 vs 경쟁력 줄다리기

4월 16, 2025

오픈AI(OpenAI)가 15일(현지 시간) AI 모델의 안전성을 평가하고 개발 및 배포 과정에서 필요한 안전장치를 결정하는 내부 시스템인 ‘준비 프레임워크(Preparedness Framework)‘를 업데이트하면서 논란이 일고 있다. 이번…

오픈AI, 안전성 보고서 없이 GPT-4.1 출시… 투명성 후퇴 논란

4월 16, 2025

오픈AI(OpenAI)가 새로운 AI 모델 시리즈인 GPT-4.1을 출시하면서 안전성 보고서 없이 진행해 논란이 일고 있다. 특히 최근 AI 업계의 안전 관행에 대한 우려가 커지는 시점에서…

구글, AI 안전성 검증 없이 제미나이 모델 출시 가속화… 투명성 우려 커져

4월 4, 2025

구글(Google)이 인공지능(AI) 모델 출시 속도를 대폭 높이면서 안전성 보고서는 뒤로 미루고 있어 업계 우려가 커지고 있다. 테크크런치(TechCrunch)는 지난 3일(현지 시간) 구글이 3월에 출시한 제미나이…

앤트로픽, 바이든 때의 ‘백악관 AI 자발적 약속’ 기록 삭제 논란

3월 6, 2025

앤트로픽(Anthropic)이 자사 웹사이트 ‘투명성 허브(Transparency Hub)’에서 백악관의 AI 자발적 약속 관련 내용을 삭제해 논란이 일고 있다. 이에 대해 앤트로픽 측은 “실질적인 내용 변화는 없으며,…

오픈AI, AI 안전성 및 조정에 대한 접근법 공개… “AGI 지능 자체만으로는 긍정적 변화 보장 못해”

3월 6, 2025

오픈AI가 6일(현지 시간) 자사 웹페이지를 통해, 최근 인공지능 발전에 따른 안전성과 조정에 관한 접근법을 공개했다. 공개된 내용에 따르면, 인류 전체에 혜택을 주는 AGI 개발을…

오픈AI, AGI 개발 위해 비영리에서 영리 기업으로 대전환 선언

12월 31, 2024

인공지능 개발 기업 오픈AI(OpenAI)가 27일(현지 시간) 인공일반지능(AGI) 개발을 위해 기업 구조를 전면 개편한다고 발표했다. 오픈AI 공식 블로그에 따르면, 오픈AI 이사회는 AGI가 인류에게 혜택을 주는…

오픈AI, 안전한 AI 개발 위한 ‘숙고형 정렬’ 기술 공개…GPT-4 뛰어넘는 성능 입증

12월 26, 2024

오픈AI(OpenAI)가 21일(현지 시간) 인공지능 언어모델의 안전성을 획기적으로 향상시킬 수 있는 ‘숙고형 정렬(Deliberative alignment)’ 기술을 공개했다. 이 기술은 O시리즈 모델에 적용되어 기존 GPT-4를 뛰어넘는 안전성…

카카오, AI 안전성 강화위한 ‘AI Safety Initiative’ 공개

11월 1, 2024

카카오가 AI 기술의 안전한 개발과 운영을 위한 ‘AI Safety Initiative’를 발표했다. 이는 글로벌 AI 규제 환경에 대응하고 윤리적이고 안전한 AI 생태계를 구축하기 위한 종합적인…

구글의 최신 이미지 생성 AI, ‘이마젠 3(Imagen 3)’ 공개

8월 19, 2024

이미지 출처: 구글 홈페이지 구글이 최신 텍스트-이미지 생성 AI 모델인 ‘이마젠 3(Imagen 3)’를 공개했다. 이마젠 3는 기존 모델들보다 더 뛰어난 품질의 이미지를 생성할 수…

AI가 AI를 학습하면 미친다??’… 품질·다양성 저하 우려

8월 16, 2024

인공지능(AI) 기술이 발전하면서 AI가 생성한 데이터로 새로운 AI 모델을 학습시키는 일이 늘고 있다. 하지만 이런 방식으로 계속 AI를 학습시키면 모델의 품질과 다양성이 저하되는 ‘모델…