QWENLONG-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning 기존 AI 모델들이 긴 문서에서 겪던 학습 효율성 저하와 불안정성 문제 알리바바 통이랩(Tongyi Lab)이 강화학습을…
검색 강화 생성(Retrieval-Augmented Generation, RAG) 시스템은 인공지능의 응답 생성 능력을 높이기 위해 외부 지식을 활용하는 기술이다. 하지만 기존 RAG 시스템들은 부적절한 정보 검색으로 인한…