Chain of Draft: Thinking Faster by Writing Less 토큰 92% 절감하면서도 정확도는 유지: 인간의 메모 습관에서 영감 얻은 AI 기술 대형 언어 모델(LLM)이 복잡한…
Multi-turn Evaluation of Anthropomorphic Behaviours in Large Language Models 14가지 의인화 행동 분석: 제미니, 클로드, GPT-4o, 미스트랄 모델 비교 연구 대화형 인공지능(AI) 시스템이 보이는…
Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling 테스트 시간 확장이 작은 언어 모델의 성능을 비약적으로 향상 테스트 시간 확장(Test-Time Scaling, TTS)은…
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention 현대 AI의 새로운 도전: 70-80%를 차지하는 어텐션 계산 문제 딥시크(DeepSeek)가 발표한 연구 논문에 따르면, 차세대…
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models 일반인도 검증 가능한 벤치마크의 필요성 AI 모델의 능력을 평가하는 벤치마크가 점점 더 전문화되면서…
Fully Autonomous AI Agents Should Not be Developed 자율성 확대되는 AI 에이전트…2024년 말 급격히 증가 허깅페이스(Hugging Face)의 연구진들이 발표한 논문에 따르면, 대규모 언어모델(LLM)의 벤치마크…
Large language models surpass human experts in predicting neuroscience results 매년 기하급수적으로 증가하는 과학 문헌, AI가 해결사로 런던 유니버시티 칼리지(UCL)와 앨런 튜링 연구소 연구진이…
LIMO: Less is More for Reasoning 817개 학습 데이터로 AIME 57.1% 정확도 달성한 LIMO의 혁신 상하이교통대학교(SJTU) 연구진이 발표한 ‘LIMO: Less is More for Reasoning’…
CODEI/O: Condensing Reasoning Patterns via Code Input-Output Prediction 수학·코드 넘어선 AI 추론력 강화의 새 길 제시 딥시크AI(DeepSeek-AI)의 연구에 따르면, 대규모 언어모델(LLM)의 추론 능력을 향상시키기…
Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations AI 시스템의 실제 활용은 컴퓨터·미디어 직종이 절반…소프트웨어 개발이 37.2% 최다 앤트로픽(Anthropic)이…
Evaluation of a trial of generative AI (Copilot) in The Treasury AI 생성 문장, 인간과 얼마나 비슷할까? 호주 재무부에서 진행한 코파일럿 실험 보고서에 따르면,…
Consistency of Responses and Continuations Generated by Large Language Models on Social Media 1200만 건의 SNS 데이터로 분석한 AI의 텍스트 생성 능력 중국과학기술대학교 연구진이…
STATE OF AI IN PR JANUARY 2025 PR업계 AI 도입률 75% 달성, 2023년 대비 3배 성장 머크랙(Muck Rack)이 발표한 ‘STATE OF AI IN PR…
AI or Aryan Ideals? A Thematic Content Analysis of White Supremacist Engagement with Generative AI 생성형 AI를 이용한 극우세력의 선전선동 실태 범죄 및 형사…
Humor as a window into generative AI bias AI와 유머가 만나는 지점에서 발견된 새로운 편견 미국 펜실베니아대학교 와튼스쿨과 하버드대학교 연구진이 발표한 연구에 따르면, 챗GPT(ChatGPT)가…
The Prompt Report: A Systematic Survey of Prompting Techniques 프롬프트 공학(prompt engineering)은 생성형 AI(Generative AI) 모델의 성능을 극대화하기 위한 핵심 기술로 자리 잡았다. 메릴랜드…
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs 중국의 기술 기업 텐센트가 설립한 AI랩과 상하이자오통대학교 연구진이 발표한 최신 논문에…
GenPod: Constructive News Framing in AI-Generated Podcasts More Effectively Reduces Negative Emotions Than Non-Constructive Framing AI가 바꾸는 뉴스 제작의 판도 AI 기반 미디어 제작이…
Age against the machine—susceptibility of large language modelsto cognitive impairment: cross sectional analysis AI 의료진 시대, 그들도 인지장애에서 자유로울까 AI가 의료계를 대체할 것이란 전망이…
ALIGNMENT FAKING IN LARGE LANGUAGE MODELS AI의 숨겨진 행동: 전략적 순응이란 무엇인가? 앤트로픽(Anthropic)과 레드우드 리서치(Redwood Research) 연구진에 따르면 인공지능 언어모델이 학습 과정에서 ‘전략적 순응(Alignment…
Language I/O가 발행한 리포트에 따르면, 챗GPT(ChatGPT)와 생성형 AI가 대중화되면서 광산업의 수율 향상과 위험 감소부터 농업 분야의 식품 폐기물 감소까지, AI는 모든 혁신의 최전선에 있다.…
챗GPT(ChatGPT)나 클로드(Claude) 같은 AI 챗봇이 때로는 자신감 넘치는 말투로 틀린 답변을 하는 경우를 본 적이 있을 것이다. 이스라엘 공과대학과 구글 연구진이 이런 AI의 ‘거짓말’을…
1990년에 제정된 미국장애인법(American Disabilities Act, ADA)은 장애인에 대한 차별을 방지하기 위한 획기적인 법안이었다. 하지만 사회가 발전하고 기술이 진보함에 따라 ADA 조항을 재평가하고 강화할 필요성이…
교육 연구에 따르면 피드백은 학습 성공에 가장 큰 영향을 미치는 요소 중 하나다. 특히 프로그래밍을 시작하는 학생들에게 적절한 피드백은 필수적이다. 하지만 현재 대부분의 프로그래밍…
심층학습 기반 얼굴인식 기술은 보안, 감시, 개인 기기 인증 등 다양한 분야에서 큰 발전을 이뤘다. 하지만 얼굴 데이터의 민감한 특성과 실제 학습 데이터셋의 편향성으로…
정보 검색(IR) 분야는 생성 AI와의 융합을 통해 큰 변화를 맞이하고 있다. 컴퓨팅 커뮤니티 컨소시엄(Computing Community Consortium, CCC) 워크숍에서는 정보 검색과 생성 AI의 융합이 가져올…
스탠포드대학교(Stanford University) 연구진이 미국 전역 40명의 이공계(STEM) 대학생과 28명의 교수진을 대상으로 실시한 연구 결과, 대학생들의 생성형 AI 사용률이 매우 높은 것으로 나타났다. 응답자의 85%가…
영국 마이크로소프트 리서치팀이 생성형 AI의 응답을 더욱 정교하게 제어할 수 있는 새로운 방식의 동적 프롬프트 미들웨어를 개발했다. 즉, 일반 사용자들이 AI와 더 쉽게 소통할…
이집트-일본 과학기술대학교(E-JUST) 연구진이 아랍어 손글씨를 높은 정확도로 인식하는 새로운 인공지능(AI) 시스템을 개발했다. 연구진은 차별화된 이진화(Differentiable Binarization)와 적응형 스케일 융합(Adaptive Scale Fusion) 기술을 결합해 기존…
이탈리아 밀라노-비코카 대학교 연구진이 개인 맞춤형 대화를 통해 사용자의 습관 개선을 돕는 GPT 기반 챗봇 ‘습관 코치(Habit Coach)’를 개발했다고 발표했다. 연구에 참여한 5명의 참가자들은…