Search

[AI와 인간 사이] 안드레 카파시의 입사 선물, llm-wiki의 혁신과 그 함정에 대하여

[AI와 인간 사이] 안드레 카파시의 입사 선물, llm-wiki의 혁신과 그 함정에 대하여
[AI와 인간 사이] 안드레 카파시의 입사 선물, llm-wiki의 혁신과 그 함정에 대하여

2026년 5월 19일, 안드레 카파시(Andrej Karpathy)가 앤트로픽에 합류한다는 소식이 전해졌다. 오픈AI(OpenAI) 공동창업자이자 테슬라 자율주행을 이끌었고, 이후 유레카 랩스(Eureka Labs)라는 AI 교육 스타트업을 운영하던 그가 다시 프런티어 연구실로 돌아온 것이다. 앤트로픽은 그가 사전학습(pre-training) 팀에서 닉 조셉(Nick Joseph) 산하로 합류하며, 클로드를 활용해 사전학습 연구를 가속하는 팀을 새로 꾸린다고 발표했다.

업계는 이 인사를 두고 “프런티어 AI 경쟁의 핵심 신호”라고 평가했다. 워크데이, 유닷컴, 인스타그램, 박스의 전임 CTO들이 줄줄이 앤트로픽에 합류해 ‘Member of Technical Staff’라는 개별 기여자(IC) 직함을 달고 있는 흐름의 정점에 카파시가 있었다.

그러나 정작 한국의 개발자 커뮤니티가 더 뜨거웠던 것은 그의 합류 발표보다 한 달 반쯤 앞선 4월 초의 일이었다. 카파시가 트위터에 가볍게 던진 한 문장의 메모와, 이틀 뒤 깃허브 지스트(Gist)에 올린 마크다운 파일 한 장. 그 한 장이 발표 48시간 만에 1,600만 회 이상 조회되고, 5,000개가 넘는 별을 받았다. 잭 도시는 “훌륭한 아이디어 파일”이라고 평했다. 한국에서도 클리앙, 요즘IT, gpters, choi.openai같은 채널들이 일제히 이 패턴을 다루기 시작했고, 유튜브에는 “안 쓰면 손해”라는 제목의 영상들이 올라왔다.

LLM 위키(LLM Wiki). 이번 칼럼은 이 한 장의 마크다운이 어떤 의미를 갖는지, 그리고 그 환호 뒤에 숨은 함정에 관한 이야기다.

아이디어 파일이라는 새로운 장르

먼저 카파시가 무엇을 공개했는지부터 짚어보자. 그는 코드를 공유하지 않았다. 앱을 출시하지도 않았다. 그가 올린 것은 단 한 장의 마크다운 파일이었고, 그 파일의 정체를 그는 ‘아이디어 파일(idea file)’이라고 이름 붙였다.

“LLM 에이전트의 시대에는 특정 코드나 앱을 공유할 필요가 줄어든다. 아이디어만 공유하면, 상대방의 에이전트가 그것을 자신의 환경에 맞게 구현해 줄 것이다.”

그의 말이다. 이것은 단순한 수사가 아니다. 사람이 사람에게 코드를 건네던 시대에서, 사람이 에이전트에게 아이디어를 건네면 에이전트가 코드를 짜는 시대로의 전환을 그대로 보여주는 선언이다. 그가 던진 마크다운은 그 자체로 실행 가능한 사양서다.

내용 자체는 단순하다. 지금까지 사람들이 LLM과 문서를 다루던 방식, 이른바 RAG(Retrieval-Augmented Generation, 검색증강생성)는 질문이 들어올 때마다 원문 더미에서 관련 조각을 찾아 답을 생성하는 방식이다. 매번 처음부터 다시 지식을 발굴한다. 아무것도 축적되지 않는다. 카파시는 이 방식의 한계를 정확히 짚었다.

대신 그는 LLM이 원천 문서와 사용자 사이에 ‘위키’라는 영속적인 층을 직접 만들고 유지하게 하자고 제안한다. 새 자료가 들어오면 LLM이 그것을 읽고, 핵심을 뽑아내고, 기존 위키의 관련 페이지들을 업데이트하고, 모순을 표시하고, 교차 참조를 갱신한다. 위키는 LLM이 쓰고 사용자는 읽는다. “옵시디언이 IDE라면, LLM은 프로그래머이고, 위키는 코드베이스다.” 카파시의 비유다.

[AI와 인간 사이] 안드레 카파시의 입사 선물, llm-wiki의 혁신과 그 함정에 대하여
이미지 생성 : GPT Images 2, 출처 : 안드레 카파시 llm-wiki.md

구조는 세 층으로 정리된다. 원천 자료층(raw sources)은 사용자가 수집한 불변의 원문이고, 위키층(wiki)은 LLM이 생성하고 관리하는 마크다운 페이지들이며, 스키마(schema)는 LLM에게 위키를 어떻게 다룰지 알려주는 규약 파일이다. 동작은 세 가지다. 새 자료를 흡수하는 인제스트(ingest), 질문을 던지는 쿼리(query), 그리고 모순과 누락을 점검하는 린트(lint). 크게 본다면 이게 전부다. 그러나 여기에는 프로젝트의 모든 지혜가 담기게 되는 ‘엄청난’ 구조다.

왜 이것이 하네스도 RAG도 아닌가

여기서 잠깐 개념 정리가 필요하다. 지난 칼럼에서 다뤘던 ‘하네스(harness)’와 이번의 ‘위키’와 ‘RAG’는 비슷해 보이지만 작동 층위가 전혀 다르다.

하네스는 클로드 코드 같은 AI 코딩 도구가 동작하는 골격이다. 어떤 도구를 언제 부를지, 컨텍스트를 어떻게 관리할지, 사용자와의 상호작용을 어떻게 짤지를 정의하는 엔지니어링 그 자체다. 모델의 능력을 끌어내는 ‘운용 기술’에 가깝다.

▶︎ 지난 칼럼: [AI와 인간 사이] 앤트로픽의 하네스 유출은 코딩의 패러다임을 바꾸고 있다

RAG는 그보다 한참 좁은 개념이다. 외부 문서를 LLM에게 참조시키기 위한 검색 파이프라인이다. 문서를 잘게 쪼개 임베딩 벡터로 만들어 데이터베이스에 저장하고, 질문이 들어오면 유사한 조각을 검색해 LLM의 입력에 끼워 넣는다. 지난 3~4년간 기업의 사내 챗봇과 지식관리 솔루션은 거의 다 이 구조였다.

LLM 위키는 이 둘 모두와 다르다. 하네스가 도구 수준의 골격이라면, 위키는 지식 수준의 자산이다. RAG가 질의 시점에 매번 원문에서 답을 다시 만든다면, 위키는 모든 자료를 미리 ‘컴파일’해 정제된 결과물로 축적해 둔다. 한 번 정리된 교차 참조가 다시 정리될 필요가 없고, 한 번 발견된 모순이 다음 질문에서 다시 발견될 필요가 없다.

링크드인의 한 분석가는 “사실 카파시가 만든 것도 일종의 RAG다. 단지 임베딩 벡터 대신 마크다운 백링크와 인덱스로 손수 만든 그래프 RAG일 뿐”이라고 정확하게 지적했다. 맞다. LLM 위키는 RAG를 죽인 패턴이 아니라, RAG의 검색 부담을 사람이 읽을 수 있는 마크다운 그래프로 이전한 패턴이다. 그래서 더 가볍고, 더 직관적이고, 무엇보다 사용자가 결과물을 눈으로 확인하고 신뢰할 수 있다.

폭발적 반응, 그리고 그림자

반응은 압도적이었다. X(구 트위터)에서만 1,600만 회 이상의 조회수를 기록했고, 깃허브 gist에서 5,000개의 star, 4,200개의 fork. 4월 초 공개 이후 한 달 안에 LLM 위키 v2를 비롯한 후속 파생 패턴들이 쏟아졌다. 한국에서도 한 개인 사용자가 옵시디언 노트 7,660개를 이 패턴으로 재구성한 경험을 공유했고, 또 다른 사용자는 카파시의 ‘ingest’를 한국어 환경에 맞게 ‘적용’으로 바꾸는 등 자신만의 변용을 시도했다.

매체들의 평가도 거창했다. “RAG는 죽었다.” “AI 시대의 메멕스(Memex, Memory+Index)가 마침내 실현됐다.” 등 온갖 찬사가 1달 안에 쏟아졌다. (부연 설명을 하자면 카파시 본인이 글 안에서 1945년 바네바 부시의 메멕스 비전을 인용하며 “메멕스가 풀지 못한 문제는 누가 유지보수를 하느냐였는데, LLM이 그것을 해결한다”고 적었기 때문에 그것을 인용하지 않았나 싶다.)

여기까지만 보면 완벽한 이야기다. 그러나 같은 한 달 동안, 실제로 이 패턴을 돌려본 사람들의 솔직한 보고서들이 조용히 쌓이고 있었다.

한국의 한 개발자는 클리앙에 올린 글에서 카파시의 원안을 그대로 적용한 결과를 비교 실험으로 정리했다. 동일한 자료를 NotebookLM의 RAG에 넣은 경우와, 자신이 구축한 LLM 위키에 넣은 경우의 답변을 비교한 것이다. 결론은 “직관적이고 시의적절한 접근이지만, 빈틈이 너무 많다”였다. 또 다른 멀티에이전트 환경의 실무자는 “구조화된 데이터와의 충돌, 그리고 정작 본인이 깊이 사고하는 능력이 약해지는 일종의 지속적인 뇌의 공백”을 호소했다.

토큰 비용에 대한 비판은 더 직접적이다. 한 링크드인(LinkedIn) 분석은 이렇게 적었다.

“카파시는 자신이 만든 것이 소규모(약 100개 자료) 실험이라고 분명히 말했다. 그런데 사람들이 이걸 놓치고 있다. 그가 만든 것은 사실상 손으로 빚은 그래프 RAG다. RAG는 비싸지 않다. pgvector를 슈퍼베이스에 띄우면 이 규모에서는 거의 무료다. 반면 위키의 모든 컴파일, 린트, 쿼리는 클로드 코드의 토큰을 태운다. 진짜 돈이다.”

이 지적의 무게를 가늠하려면 숫자가 필요하다. 클로드 코드의 평균 비용은 앤트로픽 공식 문서 기준으로 사용자 1인당 하루 약 6달러이며, 90%의 사용자가 하루 12달러 이내에서 사용한다. 팀 단위로는 개발자 1인당 월 100~200달러 수준이다. 이것은 코딩 작업 기준이다. LLM 위키를 본격적으로 운영하려면 자료를 새로 흡수할 때마다 위키 페이지 10~15개를 동시에 갱신해야 하고, 주기적인 린트는 위키 전체를 다시 훑어야 한다. 자료가 늘어날수록 인덱스 자체가 비대해져 매 쿼리에 들어가는 컨텍스트가 커진다. 이 모든 과정이 클로드 오퍼스(Opus) 같은 상위 모델에서 돌 때 의미 있는 결과가 나온다는 점은 실제로 돌려본 사람들이 공통적으로 증언하는 부분이다.

한 가지가 더 있다. LLM이 자료를 요약하고 압축해 위키에 정리하는 과정에서 발생하는 환각(hallucination)이 그대로 ‘사실’로 굳어질 위험이다. 순수 RAG에서는 잘못된 답이 일회성으로 끝나지만, 위키에서는 한 페이지의 작은 오해가 연결된 여러 페이지로 조용히 전파된다. 카파시가 ‘lint’ 단계의 중요성을 강조한 이유가 여기에 있다. 그러나 lint 역시 토큰을 태우는 작업이다.

공개의 진짜 수혜자는 누구인가

여기서 한 걸음 물러서서 보자. 카파시는 이 패턴을 공개하면서 “이건 작은 규모의 실험적 접근”이라고 분명히 적었다. 그러나 그의 영향력 앞에서 그 단서 조항은 거의 읽히지 않았다. 사람들은 그가 무한한 컴퓨팅 자원과 무한한 토큰 예산으로 이 시스템을 운영하는 풍경을 보고, 자신도 같은 결과를 낼 수 있다고 믿었다.

여기서 우리가 진지하게 던져야 할 질문이 있다. 이 공개의 진짜 수혜자는 누구인가.

표면적으로는 개인 지식 노동자들이다. RAG의 복잡한 인프라 없이 마크다운 폴더 하나로 자신만의 지식 자산을 쌓을 수 있다는 약속. 컴파운딩(compounding)되는 지식 베이스. 글자로만 봐도 달콤하고 매력적인 이야기다.

그러나 이 시스템을 실제로 돌려보면 누가 가장 이득을 보는지가 분명해진다. 첫째, LLM 위키를 의미 있게 운영하려면 상위 모델이 필요하다. 클로드 코드는 사실상 표준이 되었고, 카파시 본인도 이 패턴을 클로드 코드 환경에서 시연했다. 한국의 후속 콘텐츠들도 거의 예외 없이 “클로드 코드와 옵시디언”이라는 짝을 미리 전제한다. 둘째, 이 시스템은 한 번 세팅되면 계속 토큰을 먹는다. 새 자료를 넣을 때마다, 질문할 때마다, 점검을 돌릴 때마다. 셋째, 사용자는 카파시의 사용 예시를 본 이상 그보다 낮은 품질에 만족하지 못한다. 자신의 만족을 위해 토큰 사용량을 늘리는 방향으로 자연스럽게 끌려간다.

지난 칼럼들에서 짚었던 흐름과 함께 보면 그림이 더 선명해진다. 앤트로픽은 클로드 코드의 하네스를 사실상 업계의 ‘문법’으로 만들었다. 그 위에 ‘Skills’를 표준으로 제시했다. 이제 카파시가 LLM 위키라는 ‘지식 운영 패턴’을 들고 합류했다. 도구, 작업 방식, 지식 운용의 세 층이 모두 앤트로픽의 생태계 안에서 정의되는 구조다.

토큰 경제라는 표현을 들어본 적이 있을 것이다. AI 시대에 가치가 토큰 단위로 거래되고, 그 토큰의 흐름을 누가 통제하느냐가 곧 산업 권력이 되는 구조를 말한다. 앤트로픽은 클로드 코드 사용자의 90%를 하루 12달러 이내에 묶어둘 만큼 정교한 가격 설계를 하고 있고, 동시에 전체 산업이 더 많은 토큰을 더 비싼 모델에서 태우게끔 유도하는 콘텐츠 생태계를 키우고 있다. 카파시의 LLM 위키는 그 생태계의 가장 우아한 캠페인이다. 어떤 광고도 이만큼의 자발적 전파를 만들지 못한다. 1,600만 회 조회, 수백 편의 후속 콘텐츠, 한 달 만에 등장한 v2와 v3, 그리고 그 모든 것이 앤트로픽의 토큰 게이지를 올린다.

내가 이것을 ‘함정’이라고 말하는 이유

오해 없기를 바란다. 카파시의 LLM 위키는 훌륭한 패턴이다. 지식 노동의 새로운 형태에 대한 진지한 제안이고, 메멕스의 후예라는 그의 자기 평가도 과장이 아니다. 적합한 사용자에게는 분명 강력한 도구가 된다.

문제는 ‘적합한 사용자’의 범위가 매우 좁다는 점이다. 충분한 토큰 예산을 가진 사람, 시행착오에 들어가는 비용을 감내할 수 있는 사람, 자신의 영역과 작업 흐름에 맞춰 카파시의 원안을 비틀고 다듬을 수 있는 사람. 한국의 한 개발자가 “남의 시스템을 그대로 쓰면 반드시 어딘가에서 안 맞는 부분이 생긴다”고 적은 이유도 여기에 있다. LLM 위키는 카파시처럼 쓸 때 카파시처럼 작동한다. 그렇지 않은 사람에게는 마크다운 무덤이 되거나, 잘못된 정보가 우아하게 정리된 거짓 위키가 되거나, 매달 청구되는 토큰 영수증의 출처가 될 가능성이 작지 않다.

그렇다고 모두가 이 패턴을 외면해야 한다는 뜻은 아니다. 다만 스스로에게 이렇게 물어보자. 내가 지금 LLM 위키를 시작하려는 이유는 무엇인가. 카파시의 시연을 본 흥분 때문인가, 아니면 내가 다루는 자료의 양과 성격이 이 패턴을 정말로 요구하기 때문인가. 후자라면 시도할 가치가 충분하다. 전자라면, 잠시 멈춰서 자신이 누구의 토큰 경제에 자발적으로 합류하고 있는지를 한 번쯤 짚어볼 필요가 있다.

지난 칼럼에서 나는 AI 발전을 멈추지 못하는 폭주기관차에 비유하며, 사용자가 그 가속의 공범이라는 이야기를 했다. LLM 위키의 환호는 그 공범 의식이 작동하는 방식을 정확히 보여주는 사례다. 우리는 카파시의 시연에 매혹돼, 그가 가진 자원의 규모를 잊은 채, 자신의 만족을 위해 기꺼이 토큰을 더 태운다. 그리고 그 토큰의 종착지는 결국 한 회사다.

▶︎ 지난 칼럼: [AI와 인간 사이] 왜 인간은 대체될 때까지 기술 발전을 멈추지 않을까? AI라는 폭주기관차

카파시의 큰 그림은 그래서 위키 자체가 아니다. 그가 자신의 영향력으로 어떤 패턴을 보편화하면, 그 패턴의 인프라적 종착지가 어디인지를 그도, 앤트로픽도 정확히 알고 있다. 5월 19일 그가 앤트로픽의 사전학습 팀에 합류했다는 사실은 4월 초 그가 LLM 위키를 공개했던 시점에 이미 합류 협의가 진행되고 있었음을 시사한다. 그 공개가 입사 선물이었는지, 아니면 단순한 우연의 일치였는지는 알 수 없다. 다만 결과적으로 그가 만든 영향력의 흐름과 앤트로픽의 사업 전략이 같은 방향을 향하고 있다는 사실은 분명하다.

당신이 마크다운 폴더 두 개를 만들기 전에, 적어도 그 사실을 알고 시작했으면 한다.

이 칼럼은 [AI와 인간 사이] 시리즈의 일곱 번째 글입니다.

이미지 출처: 이디오그램 생성