허깅페이스(Hugging Face)의 공동 창업자이자 최고경영자(CEO)인 클렘 들랑그는 현재 AI 버블이 아닌 ‘LLM 버블’ 상황이며, 이 거품이 곧 꺼질 수 있다고 전망했다. 테크크런치에 따르면, 18일(현지…
현재의 인공지능(AI) 모델들은 중요한 과학적 발견을 이끌어낼 가능성이 낮다는 주장이 나왔다. 이는 AI 기술을 둘러싼 과열된 기대와 업계 주요 인사들의 주장에 찬물을 끼얹는 발언이다.…
SK텔레콤이 자체 개발한 초거대 언어모델(LLM) ‘에이닷 엑스(A.X) 3.1’을 24일(한국 시간) 오픈소스 플랫폼 허깅페이스(Hugging Face)에 공개하며 국내 AI 기술 독립의 신호탄을 쐈다. 이번에 공개한 A.X…
KT가 자체 개발한 한국어 특화 언어모델 ‘믿:음 2.0’을 오픈소스로 공개한다고 3일(한국 시간) 발표했다. 이번 공개는 AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 이뤄지며, 기업과 개인, 공공기관…
SK텔레콤이 세계 최고 수준의 한국어 처리 능력을 보유한 대규모 언어 모델(LLM) ‘에이닷 엑스(A.X) 4.0’을 오픈소스로 공개했다고 3일(한국 시간) 발표했다. SK텔레콤은 이날 오전 세계적인 오픈소스…
허깅페이스(Hugging Face)가 로봇공학을 위한 경량 오픈소스 비전-언어-액션(Vision-Language-Action) 모델 ‘스몰VLA(SmolVLA)’를 3일(현지 시간) 공개했다. 허깅페이스 블로그에 공개된 내용에 따르면, 스몰VLA-450M은 4억 5천만 개의 매개변수를 가진 컴팩트한…
Trends – Artificial Intelligence (AI) ‘인터넷의 여왕’ 메리 미커, 6년 만에 복귀해 AI 혁명 진단 벤처캐피털 업계의 전설적 인물인 메리 미커(Mary Meeker)가 6년 만에…
구글이 사용자들이 스마트폰에서 다양한 AI 모델을 직접 다운로드하고 실행할 수 있는 앱을 조용히 출시했다. 테크크런치가 31일(현지 시간) 보도한 내용에 따르면, 구글 AI 엣지 갤러리(Google…
테크크런치가 28일(현지 시간) 보도한 내용에 따르면, 중국 스타트업 딥시크(DeepSeek)가 수요일 아침 위챗 메시지를 통해 발표한 R1 추론 AI 모델의 업데이트 버전을 개발자 플랫폼 허깅페이스(Hugging…
A Deep Dive into Deep Research Tools 검색에서 AI 대화형으로, 이제는 딥 리서치 시대 AI 기반 시장 정보 검색 및 분석 플랫폼 알파센스(Alphasense)가 발표한…
카카오가 생성형 AI의 안전성과 신뢰성을 검증하는 AI 가드레일 모델 ‘카나나 세이프가드(Kanana Safeguard)’를 개발해 국내 기업 최초로 오픈소스로 공개했다고 27일(한국 시간) 밝혔다. 생성형 AI 서비스…
카카오가 자체 개발한 인공지능 언어모델 ‘카나나 1.5’ 4종을 오픈소스로 공개했다고 23일(한국 시간) 발표했다. 카카오는 이날 8B와 2.1B 크기의 카나나 1.5 모델을 허깅페이스(Hugging Face)에 공개했다.…
생성형 AI 시장에서 코드 개발 도구가 가장 두드러진 성장세를 보이고 있는 것으로 나타났다. 시밀러웹(Similarweb)의 ‘생성형 AI 글로벌 섹터 동향’ 보고서에 따르면, 코드 완성 및…
구글(Google)의 오픈소스 인공지능 모델 젬마(Gemma)가 출시 후 약 1년 만에 1억 5천만 다운로드를 돌파하는 쾌거를 이뤘다. 이는 오픈소스 AI 모델 시장에서 구글의 입지가 강화되고…
알리바바 클라우드(Alibaba Cloud)가 17일(현지 시간) 첫 번째 프레임-비디오 변환 대규모 AI 모델인 ‘Wan2.1-FLF2V-14B’를 오픈소스로 공개했다. 이 모델은 디지털 아티스트들에게 전례 없는 효율성과 창의적 유연성을…
메타(Meta)가 새로운 라마 4(Llama 4) 시리즈를 발표했다. 5일(현지 시간) 메타 공식 블로그에 올라온 내용에 따르면, 이번에 공개된 ‘라마 4 스카우트(Llama 4 Scout)’와 ‘라마 4…
알리바바 클라우드(Alibaba Cloud)가 27일(현지 시간) 자사 홈페이지를 통해 텍스트, 이미지, 오디오, 비디오를 통합 처리하는 엔드투엔드 멀티모달 AI 모델 ‘Qwen 2.5-옴니-7B(Qwen2.5-Omni-7B)’를 출시했다고 밝혔다. 이 모델은…
미스트랄 AI(Mistral AI)가 동급 최고 성능을 자랑하는 새로운 AI 모델 ‘미스트랄 스몰 3.1(Mistral Small 3.1)’을 발표했다. 17일(현지 시간) 미스트랄 홈페이지에 발표된 내용에 따르면, 이…
구글(Google)이 단일 GPU나 TPU에서 실행 가능한 새로운 오픈 AI 모델 ‘젬마 3(Gemma 3)’를 출시했다. 젬마 3는 구글의 제미나이 2.0(Gemini 2.0) 기술을 기반으로 개발된 경량화된…
마누스 AI(Manus AI)의 샌드박스 런타임 코드가 일반 사용자에게 공개되는 상황이 발생했지만, 회사 측은 이를 문제시하지 않는다는 입장을 밝혔다. 지난 10일(현지 시간) 한 사용자가 마누스…
강화학습(RL)을 대규모로 적용하면 기존의 사전 훈련 및 후속 훈련 방법을 넘어서는 모델 성능을 실현할 수 있다. 퀜(Qwen) 팀이 최근 320억 개의 파라미터만으로 6710억 개…
구글(Google)이 코랩(Colab)에 인공지능 기반 데이터 사이언스 에이전트를 공식 출시했다. 3일(현지 시간) 구글 개발자 블로그에 발표된 내용에 따르면, 이 도구는 제미나이(Gemini)를 활용해 데이터 분석 과정을…
Fully Autonomous AI Agents Should Not be Developed 자율성 확대되는 AI 에이전트…2024년 말 급격히 증가 허깅페이스(Hugging Face)의 연구진들이 발표한 논문에 따르면, 대규모 언어모델(LLM)의 벤치마크…
허깅페이스(Hugging Face)가 로봇을 자연어로 제어할 수 있는 비전-언어-액션 플로우 모델 ‘Pi0(파이제로)’를 오픈소스로 공개했다. 이는 로봇 제어 전문 기업 르로봇(LeRobot)이 개발한 최초의 공개형 로봇 제어…
테크크런치가 20일(현지 시간)에 보도한 내용에 따르면, 중국의 인공지능 연구소 딥시크(DeepSeek)가 자사의 추론 AI 모델 ‘딥시크-R1(DeepSeek-R1)’을 공개했다. 이 모델은 특정 AI 벤치마크에서 오픈AI(OpenAI)의 O1 모델을…
오픈AI(OpenAI)의 공식 X(구 트위터)에 따르면, 챗GPT(ChatGPT)가 맞춤형 응답 기능을 대폭 개선했다. 18일(현지 시간)에 발표된 내용에 따르면, 새로운 사용자 인터페이스(UI)를 통해 사용자들은 챗GPT의 특성, 대화…
엔비디아가 CES 2025 키노트를 통해 기업용 에이전트형 AI 개발을 위한 ‘라마 네모트론(Llama Nemotron)’ 대규모 언어 모델군을 공개했다. 이는 6억 5천만 회 이상의 다운로드를 기록한…
On LLMs-Driven Synthetic Data Generation, Curation, and Evaluation: A Survey 중국 저장대학교와 하얼빈공과대학교 공동 연구진이 발표한 최신 연구에 따르면, 대규모 언어모델(LLM)을 활용한 합성데이터 생성…
What is the Role of Small Models in the LLM Era: A Survey 영국 임페리얼 칼리지 런던과 프랑스 소다 연구소가 발표한 연구에 따르면, 거대언어모델(LLM)이…
구글(Google)이 5일(현지시간) 시각과 언어를 함께 처리할 수 있는 AI 모델 ‘팔리젬마2(PaliGemma 2)’를 공개했다. 구글 개발자 블로그에 따르면, 팔리젬마2는 지난 5월 출시된 젬마(Gemma) 제품군의 첫…