카카오가 일상 대화부터 복잡한 문제 해결까지 하나의 모델로 처리할 수 있는 하이브리드 AI 모델을 선보였다. 카카오는 5일 자체 개발한 멀티모달 언어모델 ‘카나나-v-4b-하이브리드(Kanana-v-4b-hybrid)’의 성능을 공개했다고 밝혔다. 이 모델은 가벼운 일상 대화부터 논리적 사고가 필요한 복잡한 문제까지 처리할 수 있는 것이 특징이다.
기존 AI 모델들은 복잡한 표나 영수증을 읽거나 수학 문제를 풀 때 계산 실수를 하거나 조건을 빠뜨리는 경우가 많았다. 또 존재하지 않는 정보를 그럴듯하게 만들어내는 ‘환각’ 현상도 빈번했다. 새로운 모델은 이런 문제를 크게 줄였다는 게 카카오 측 설명이다.
이번 모델은 단순히 이미지를 텍스트로 변환하거나 설명하는 수준을 넘어, 복잡한 영수증이나 표의 데이터를 정확히 읽고 계산까지 해낸다. 수학 문제를 풀 때도 조건을 꼼꼼히 확인하고 답을 검증하는 과정을 거쳐 정확도를 높였다.
한국어 사용자에게 특히 유용한 기능도 추가됐다. 기존 글로벌 AI 모델들은 한국어 질문을 영어로 번역해서 생각한 뒤 다시 한국어로 번역해 답하는 과정에서 맥락이 어긋나는 경우가 많았다. 하지만 이 모델은 한국어 질문을 그대로 이해하고 한국어로 사고하도록 훈련됐다. 실제로 대학수학능력시험 사회탐구나 수학 문제에서 한국어의 미묘한 조건들을 정확히 파악하고 높은 정답률을 기록했다. 한국 교육 체계 기반의 AI 학력 평가 벤치마크인 ‘코넷(KoNET)’에서는 92.8점을 받았다.

유사 크기의 글로벌 모델 큐웬3-VL-4B(Qwen3-VL-4B), 인턴VL3.5-4B(InternVL3.5-4B), GPT-5-나노(GPT-5-nano)와 비교해도 과학, 공학, 문서 이해 등 여러 영역에서 우수한 성능을 보였다. 특히 수학과 과학처럼 복잡한 추론이 필요한 분야에서는 글로벌 모델보다 높은 점수를 받았다.
카카오는 앞으로 사용자가 모드를 직접 선택할 필요 없이 AI가 질문의 난이도를 스스로 판단해 일반 모드와 추론 모드를 자동으로 전환하도록 개선할 계획이다. 간단한 질문에는 빠르게 답하고, 복잡한 문제에는 깊이 생각해서 답하는 식으로 자동 조절된다는 의미다. 이를 통해 하나의 대화창에서 끊김 없이 자연스러운 대화가 가능해지고, 비용 효율도 높아질 전망이다.
카카오 김병학 카나나 성과리더는 “일상 대화부터 복잡한 작업까지 모두 하나의 AI에 맡길 수 있는 혁신적인 연구 성과”라며 “한국어 환경에서 가장 자연스럽고 정확하게 생각하고 답변할 수 있는 모델”이라고 밝혔다.
카카오는 지난달 에이전틱 AI 구현에 최적화된 ‘카나나-2(Kanana-2)’를 오픈소스로 공개하는 등 자체 AI 기술 개발을 지속하고 있다.
해당 기사의 원문은 카카오에서 확인 가능하다.
이미지 출처: 카카오





![[CES 2026] 가격표 붙은 ‘휴머노이드 로봇’ 시대… 집안을 보여줄 준비가 됐습니까?](https://aimatters.co.kr/wp-content/uploads/2026/01/AI-매터스-기사-썸네일-CES2026-robots.jpg)
