Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5%…
s3: You Don’t Need That Much Data to Train a Search Agent via RL 단 2,400개 샘플로 17만…
질문: 21대 대선 당선자 확정 시간을 예측해줘. 그록 답변: 제21대 대한민국 대통령 선거의 당선자 확정 시간은 여러 변수에…
Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습…
Emergent social conventions and collective bias in LLM populations 4가지 AI 모델, 15라운드 만에 전체 집단이 하나의 관습에…
질문: 짐 로저스가 이재명을 지지한 적이 없다고 밝혔는데, 이게 무슨 일이고 어떤 의미인지 자세히 정리해서 알려줘. 그록 답변:…
2024 지능정보사회 이용자 패널조사 생성형 AI 이용자 수 전년 대비 두 배 증가… 이용시간도 45.9분으로 연장 2024년 한국의…
“대부분 사람들이 이런 일이 곧 일어날 것이라는 사실을 모르고 있다. 미친 소리로 들리겠지만, 사람들은 그냥 믿지 않는다.” 앤트로픽…
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds “왼쪽 물건 가져와” 명령을 이해하는 로봇의 핵심 기술,…
삼성전자가 갤럭시 스마트폰 시리즈의 인공지능(AI) 기능에 구글이 아닌 다른 업체의 서비스를 활용하는 방안을 적극 검토하고 있다. 블룸버그가 1일(현지…