지금까지 개발자들은 커서(Cursor), 윈드서프(Windsurf), 깃허브 코파일럿(GitHub Copilot) 같은 AI 코딩 도구를 주로 사용해 왔다. 이런 도구들은 화면에서 코드를 직접 작성하고 수정하는 방식으로 작동한다. 하지만 최근 AI 기술이 발전하면서 새로운 변화가 일어나고 있다. 테크크런치가 15일(현지 시간) 보도한 내용에 따르면, AI가 코드를 직접 편집하는 대신, 컴퓨터의 ‘터미널’이라는 곳에서 작업하는 경우가 늘어나고 있다. 터미널은 90년대 해커 영화에서 본 검은 화면에 하얀 글자가 나오는 그 화면이다. 겉보기에는 구식 같아 보이지만, 실제로는 매우 강력한 도구다.
주요 AI 회사들도 이런 변화에 주목하고 있다. 테크크런치에 따르면, 올해 2월부터 앤트로픽(Anthropic), 딥마인드(DeepMind), 오픈AI(OpenAI) 같은 회사들이 모두 터미널에서 작동하는 코딩 도구를 출시했다. 각각 클로드 코드(Claude Code), 제미나이 CLI(Gemini CLI), CLI 코덱스(CLI Codex)라는 이름으로, 벌써 인기 제품이 되었다. 이런 변화가 일어나는 동안 기존의 인기 도구들은 어려움을 겪고 있다. AI 코드 편집기 윈드서프는 회사 내부 분쟁과 인수합병으로 혼란스러운 상황이다. 구글이 핵심 직원들을 빼가고, 남은 회사는 다른 회사에 팔리면서 앞으로 어떻게 될지 불확실해졌다.
더 큰 문제는 기존 도구들의 효과에 대한 의문이다. 최근 연구에 따르면, 개발자들은 AI 코딩 도구를 쓰면 20~30% 빨라진다고 생각했지만, 실제로는 오히려 20% 느려진 것으로 나타났다. 즉, 도구가 도움이 되기보다는 오히려 방해가 되고 있었던 것이다. 이런 상황에서 워프(Warp)라는 회사가 주목받고 있다. 워프는 기존 코드 편집기와 터미널 도구의 중간 지점을 노리는 제품을 만들고 있다. 워프 창립자 잭 로이드(Zach Lloyd)는 터미널의 장점을 강조한다. “터미널은 컴퓨터 시스템의 가장 기본적인 부분이라서, AI가 가장 다양한 일을 할 수 있는 곳이다”라고 설명했다.
기존 도구와 새로운 방식의 차이점을 이해하려면 평가 방법을 살펴보면 된다. 기존 AI 코딩 도구들은 주로 ‘깃허브 이슈’라는 것을 해결하는 데 초점을 맞췄다. 이는 쉽게 말해 ‘고장 난 코드를 고치는 것’이다. 반면 터미널 기반 도구들은 더 넓은 범위의 일을 한다. 코드 수정뿐만 아니라 프로그램이 실행되는 전체 환경을 다룬다. 예를 들어 서버 설정을 바꾸거나 프로그램이 왜 실행되지 않는지 찾아내는 일도 포함한다.
새로운 평가 방법인 ‘터미널벤치’에서는 더 복잡한 문제들을 다룬다. 한 문제는 압축된 파일을 풀어주는 프로그램을 보고, 반대로 파일을 압축하는 방법을 알아내라고 한다. 다른 문제는 리눅스 운영체제를 처음부터 만들라고 하는데, 필요한 파일을 어디서 가져와야 하는지는 알려주지 않는다. 이런 문제들은 프로그래머가 실제로 겪는 상황과 비슷하다. 단순히 코드만 고치는 게 아니라 여러 단계를 거쳐 문제를 해결해야 한다. 터미널벤치 공동 제작자 알렉스 쇼(Alex Shaw)는 “어려운 건 문제 자체가 아니라 AI가 그 문제를 해결해야 하는 환경”이라고 말했다.
현재 가장 좋은 성능을 보이는 워프도 문제의 절반 정도만 해결할 수 있다. 이는 아직 갈 길이 멀다는 뜻이지만, 동시에 큰 잠재력이 있다는 의미이기도 하다.
해당 기사의 원문은 테크크런치에서 확인 가능하다.
이미지 출처: 이디오그램 생성