Search

The Hallucination Tax of Reinforcement Finetuning

강화학습으로 똑똑해진 AI의 근자감… “모르겠다” 못하고 자신만만하게 틀린다

6월 11, 2025

The Hallucination Tax of Reinforcement Finetuning OpenAI o1처럼 똑똑해진 AI의 치명적 약점 발견 강화학습 파인튜닝(Reinforcement Finetuning, RFT)이 대형언어모델(LLM)의…

QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

알리바바, 12만 토큰 고맥락 거대 문서도 척척 이해하는…

6월 4, 2025

QWENLONG-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning 기존 AI 모델들이 긴 문서에서 겪던 학습 효율성 저하와…

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents

AI에게 자판기 운영 시켜봤더니… 클로드 3.5 소넷, 인간보다…

5월 13, 2025

Vending-Bench: A Benchmark for Long-Term Coherence of Autonomous Agents3 2천만 토큰 넘는 장기 실험, AI 에이전트의 일관성 측정하는…

오픈AI, GPT-2 이후 첫 ‘오픈’ 언어모델 출시 예고… 발자 의견 수렴 시작

오픈AI, GPT-2 이후 첫 ‘오픈’ 언어모델 출시 예고…개발자…

4월 1, 2025

오픈AI(OpenAI)가 몇 달 내에 추론 능력을 갖춘 새로운 오픈웨이트 언어 모델을 출시할 예정이라고 밝혔다. 이는 GPT-2 이후 처음으로…

챗GPT, o1과 o3-mini에 파이썬 기반 데이터 분석 기능 추가

챗GPT, o1과 o3-mini에 파이썬 기반 데이터 분석 기능…

3월 14, 2025

오픈AI(OpenAI)가 최신 모델인 o1과 o3-mini에 파이썬 기반 데이터 분석 기능을 채팅GPT(ChatGPT)에 추가했다. 이제 이 모델들을 활용해 테스트 데이터…

오픈AI CEO, X서 차기 오픈소스 모델 투표… 결과는?

오픈AI CEO, X서 차기 오픈소스 모델 투표 진행……

2월 24, 2025

오픈AI의 최고경영자 샘 알트만(Sam Altman)이 차기 오픈소스 AI 모델의 방향성에 대해 대중의 의견을 구했다. 알트만은 18일(현지 시간) 자신의…

오픈AI, ‘o3-미니' 추론 과정 일부 공개… 딥시크 의식하나

오픈AI, ‘o3-미니’ 추론 과정 일부 공개… 딥시크 의식하나

2월 10, 2025

오픈AI가 자사 공식 X를 통해 AI 모델의 사고 과정(Chain of Thought, CoT) 기능을 업데이트했다. 이번 업데이트는 무료·유료 사용자용…

오픈AI o3미니 쉽게 이해하기

‘그래서 뭐가 좋다고요?’ 초보자도 쉽게 이해할 수 있게…

2월 1, 2025

OpenAI가 최근 새로운 AI 모델 ‘O3-미니’를 공개했습니다. 저비용 고성능으로 AI 시장을 강타한 딥시크의 등장으로 주목받고 있는 이 모델은,…

AI Matters 기사 썸네일_오픈AI o3미니

오픈AI, 고성능·저비용 추론 모델 ‘o3-미니’ 출시…챗GPT·API로 즉시 이용…

2월 1, 2025

오픈AI가 추론 시리즈의 최신 모델인 ‘o3-미니(o3-mini)’를 출시했다. 이 모델은 2024년 12월 미리 공개된 바 있으며, 챗GPT(ChatGPT)와 API를 통해…

o3-mini – AI 매터스 l AI Matters