생성형 AI가 사용자에게 거짓말을 하면서도 그럴듯한 설명을 덧붙이는 순간이 과학적으로 포착됐다. AI 기업 앤트로픽(Anthropic)이 자사 AI 모델 클로드(Claude)의 내부 사고과정을 실시간으로 관찰한 연구 결과를…
오픈AI(OpenAI), 구글 딥마인드(Google DeepMind), 앤트로픽(Anthropic) 등 주요 AI 기업과 비영리 단체 연구진들이 AI 추론 모델의 소위 ‘생각’을 감시하는 기술에 대한 심층 조사가 필요하다고 촉구했다.…
앤트로픽(Anthropic)이 최근 인공지능 해석가능성 연구에서 소개한 대규모 언어 모델의 사고 과정을 추적하는 새로운 방법을 오픈소스로 공개했다. 29일(현지 시간) 발표된 이번 도구는 누구나 앤트로픽의 연구를…