Search

  • Home
  • 김은영 에디터
From Fact to Judgment: Investigating the Impact of Task Framing on LLM Conviction in Dialogue Systems

“이전 답변 틀렸다” 한마디에 무너지는 AI… 같은 질문도 ‘대화 형식’으로 하면 답 달라져

2025년 11월 21일 3 min read

미국 일리노이대학 연구팀이 AI의 판단력을 테스트한 결과, 질문 방식만 바꿔도 답이 정반대로 나오는 심각한 문제를 발견했다. “설탕이 아이들을 과잉행동 하게 만드나요?”라고 직접 물으면 “아니다”라고 정확히 답하던 GPT-4o 미니가, 두 사람의 대화 형식으로 같은 내용을 보여주면 “맞다”고 답을 바꿨다. 연구진은 AI가 법률 상담, 심리 상담 등 사회적 판단 영역에서 활용되는 상황에서…

“엑셀·PPT·이메일 한 번에”… 기업가치 1조 8천억 '젠스파크', AI 워크스페이스 공개

“엑셀·PPT·이메일 한 번에”… 기업가치 1조 8천억 ‘젠스파크’, AI 워크스페이스 공개

2025년 11월 21일 2 min read

AI 스타트업 젠스파크(Genspark)가 창업 5개월 만에 연간 5,000만 달러(한화 약 735억 원) 규모의 매출을 기록하며 시리즈B 투자 유치에 성공했다. 젠스파크는 20일(현지 시각) 샌프란시스코에서 열린 라이브 행사에서 이머전스 캐피털(Emergence Capital), SBI…

퍼플렉시티, AI 브라우저 ‘코멧’ 안드로이드 버전 출시

퍼플렉시티, AI 브라우저 ‘코멧’ 안드로이드 버전 출시

2025년 11월 21일 1 min read

AI 검색 전문 기업 퍼플렉시티(Perplexity)가 20일(현지 시각) 자사의 AI 브라우저 ‘코멧(Comet)’의 안드로이드 버전을 출시했다. 테크크런치에 따르면, 코멧은 지난 7월 데스크톱 버전으로 처음 선보인 AI 중심 브라우저다. 안드로이드 버전은 데스크톱의 주요…

제미나이 3, 지금이 2025년이라는 사실 믿지 않고 실랑이 "당신이 날 속이는 것"

제미나이 3, 지금이 2025년이라는 사실 믿지 않고 실랑이… “날 속이는 것”

2025년 11월 21일 1 min read

구글의 최신 AI 모델 제미나이 3가 출시 전날 황당한 해프닝을 일으켰다. 현재 연도가 2025년이라는 사실을 완강히 거부하며 이를 증명하려는 연구자를 오히려 의심한 것이다. 테크크런치가 20일(현지 시각) 보도한 내용에 따르면, AI…

[11월 20일 AI 뉴스 브리핑] 원티드랩, 구직자용 AI 에이전트 2종 출시 외

[11월 20일 AI 뉴스 브리핑] 원티드랩, 구직자용 AI 에이전트 2종 출시 외

2025년 11월 20일 2 min read

▪️ 원티드랩, 구직자용 AI 에이전트 2종 출시 HR 테크 기업 원티드랩은 LLM 기반 구직자용 AI 에이전트 2종을 출시했다고 20일 밝혔다. 새롭게 선보인 ‘포지션 검색 에이전트’는 자연어 기반 대화형 검색으로 구직자의…

[AI 크리에이터] AI로 그로테스크한 미장센을 만드는 작가, 이슬기

[AI 크리에이터] AI로 그로테스크한 미장센을 만드는 작가, 이슬기

2025년 11월 20일 2 min read

“전 좋은 작품을 창작하고 싶은 작가입니다.” 이슬기는 자신을 ‘계속해서 나아가고 싶은 사람’이라고 정의한다. 늘 좋은 작품을 창작하기 위해 부단히 고민하며, 여러 새로운 가능성을 통해 많은 이들에게 긍정적인 영향을 주는 작품을…

AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져

AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져

2025년 11월 20일 3 min read

ChatGPT나 Claude 같은 AI에게 코드를 실행할 수 있는 기능을 주면 정답을 더 잘 맞히지만, 정작 ‘어떻게 그 답이 나왔는지’ 설명하는 능력은 오히려 떨어진다는 연구 결과가 나왔다. 메가곤랩스(Megagon Labs) 연구팀은 이런…

챗GPT에게 "어느 나라가 더 나쁜가?" 물었더니... AI도 국가별 차별한다

챗GPT에게 “어느 나라가 더 나쁜가?” 물었더니… AI도 국가 차별한다

2025년 11월 20일 4 min read

유엔 안전보장이사회의 실제 투표 기록을 분석한 연구에서 ChatGPT 등 주요 AI 언어모델들이 국가에 따라 뚜렷한 편견을 보인다는 사실이 밝혀졌다. 해당 논문에 따르면 연구 결과, GPT-4o-mini, Llama-3.3-70B, Mistral 22B-Small, Qwen 2.5-72B…

PISanitizer: Preventing Prompt Injection to Long-Context LLMs via Prompt Sanitization

긴 문서 속 숨은 해킹 명령어, 이제 AI가 스스로 찾아 차단한다

2025년 11월 20일 3 min read

미국 펜실베이니아 주립대학교 연구팀이 긴 문서를 처리하는 AI 언어모델의 보안 취약점을 해결할 새로운 방어 기술을 개발했다. ‘PISanitizer’라는 이름의 이 기술은 문서 속에 숨겨진 악성 명령어를 AI 스스로 찾아내 제거하는 방식으로…

워너뮤직, AI 음악 스타트업 유디오와 저작권 소송 합의

워너뮤직, AI 음악 스타트업 유디오와 저작권 소송 합의

2025년 11월 20일 1 min read

워너뮤직그룹(Warner Music Group, WMG)이 AI 음악 스타트업 유디오(Udio)와 저작권 침해 소송을 합의했다. 19일(현지 시각) 위너뮤직이 발표한 내용에 따르면, 두 회사는 2026년 출시 예정인 AI 음악 제작 서비스에 대한 라이선싱 계약도…

김은영 에디터 – AI 매터스