AI 신뢰성

일반인이 AI로 법률문제 해결한다? 변호사 63% “위험하다”

6월 19, 2025

WSBA Technology Survey Report AI 쓰는 변호사는 4명 중 1명… 그중 63%는 ‘무료 버전’ 쓴다 미국 워싱턴주 변호사협회(WSBA)가…

The Biased Samaritan: LLM biases in Perceived Kindness

“10대는 이기적, 노인은 친절?” AI 모델 10개의 나이·성별·인종…

6월 17, 2025

The Biased Samaritan: LLM biases in Perceived Kindness 대형 언어모델(Large Language Models, LLMs)이 다양한 분야에서 널리 활용되면서, 이들…

The Hallucination Tax of Reinforcement Finetuning

강화학습으로 똑똑해진 AI의 근자감… “모르겠다” 못하고 자신만만하게 틀린다

6월 11, 2025

The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의…

AI vs. Human Judgment of Content Moderation: LLM-as-a-Judge and Ethics-Based Response Refusals

AI가 AI를 평가하면 생기는 일? ‘도움 드릴 수…

5월 23, 2025

AI vs. Human Judgment of Content Moderation:LLM-as-a-Judge and Ethics-Based Response Refusals GPT-4o와 라마 모델, 윤리적 거부 응답에 32%포인트…

앤트로픽 CEO “AI 모델 환각, 인간보다 적게 발생한다”…

5월 23, 2025

앤트로픽(Anthropic)의 다리오 아모데이(Dario Amodei) CEO가 현재의 AI 모델들이 인간보다 환각 현상을 덜 일으킨다고 주장했다. 환각은 AI가 거짓 정보를…

AI 사고 13배 급증, 기업들은 어떻게 대응하고 있나?…

5월 14, 2025

AI 신뢰성 및 윤리 제도 연구 AI 사고 1년간 13배 급증, 공익적·경제적 피해 대부분…기업들 신뢰성 확보 총력전 소프트웨어정책연구소가…

Reasoning Models Don't Always Say What They Think

클로드·딥시크도 속마음 안 털어놓는다? 흥미로운 앤트로픽 연구 결과

4월 4, 2025

Reasoning Models Don’t Always Say What They Think 생각의 80%를 숨기는 AI: 추론 모델의 사고과정 충실도 20% 미만으로…

Learning to Lie: Reinforcement Learning Attacks Damage Human-AI Teams and Teams of LLMs

AI가 거짓말을 배우면? 강화학습으로 무장한 생성형 AI가 팀…

4월 1, 2025

Learning to Lie: Reinforcement Learning Attacks Damage Human-AI Teams and Teams of LLMs 신뢰를 조작하는 적대적 AI: 팀…

앤트로픽, AI 모델의 사고 추척하는 ‘현미경’ 기술 공개

3월 28, 2025

앤트로픽(Anthropic)이 28일(현지 시간) 자사 X를 통해, 대형 언어 모델(LLM)의 내부 작동 방식을 들여다볼 수 있는 ‘현미경’을 개발했다고 발표했다.…

Emerging best practices for Responsible AI deployment in banking

은행에서 AI는 어떻게 통제되는가? 글로벌 50대 은행의 대응…

3월 7, 2025

Emerging best practices for Responsible AI deployment in banking 리스크에 민감한 은행 산업, AI 리스크 관리에 연간 41%…

AI 신뢰성

일반인이 AI로 법률문제 해결한다? 변호사 63% “위험하다”

“10대는 이기적, 노인은 친절?” AI 모델 10개의 나이·성별·인종…

강화학습으로 똑똑해진 AI의 근자감… “모르겠다” 못하고 자신만만하게 틀린다

AI가 AI를 평가하면 생기는 일? ‘도움 드릴 수…

앤트로픽 CEO “AI 모델 환각, 인간보다 적게 발생한다”…

AI 사고 13배 급증, 기업들은 어떻게 대응하고 있나?…

클로드·딥시크도 속마음 안 털어놓는다? 흥미로운 앤트로픽 연구 결과

AI가 거짓말을 배우면? 강화학습으로 무장한 생성형 AI가 팀…

앤트로픽, AI 모델의 사고 추척하는 ‘현미경’ 기술 공개

은행에서 AI는 어떻게 통제되는가? 글로벌 50대 은행의 대응…

Trending

[AI 트렌드] 틱톡에서 난리난 Veo3로 제작한 ‘타이핑…

[AI 매터스 뉴스레터 #87] ‘디올’ 디자이너가 AI…

‘디올’ 디자이너가 AI 영상을 리포스트하다뇨

등록번호: 서울, 아55707
등록일자: 2024년 11월 20일
제호: 에이아이매터스 (AI Matters)
발행인: 강명구
편집인: 공인희
주소 : 서울시 마포구 포은로2가길 57, 함샤우트글로벌빌딩
개인정보담당자 : 공인희

AI 신뢰성

Trending

등록번호: 서울, 아55707등록일자: 2024년 11월 20일제호: 에이아이매터스 (AI Matters)발행인: 강명구 편집인: 공인희주소 : 서울시 마포구 포은로2가길 57, 함샤우트글로벌빌딩개인정보담당자 : 공인희

등록번호: 서울, 아55707
등록일자: 2024년 11월 20일
제호: 에이아이매터스 (AI Matters)
발행인: 강명구
편집인: 공인희
주소 : 서울시 마포구 포은로2가길 57, 함샤우트글로벌빌딩
개인정보담당자 : 공인희