스탠퍼드대학교 연구팀이 생성형 AI를 활용해 세계에서 가장 유명한 버거인 빅맥(Big Mac)과 동등하거나 더 나은 맛을 내면서도 환경 영향은 10분의 1 수준으로 줄이고 영양가는 2배 가까이 높인 버거 레시피를 개발하는 데 성공했다. 해당 논문에 따르면, 이번 연구는 AI가 단순히 데이터를 조합하는 수준을 넘어 인간의 미각을 학습하고 복잡한 식품 설계 문제를 해결할 수 있음을 입증했다는 점에서 주목받고 있다.
AI가 220만 개 레시피에서 인간의 입맛을 배우다
연구팀은 푸드닷컴에 공개된 50만 개 이상의 레시피 데이터에서 버거 레시피 2,216개를 선별해 AI 모델을 훈련시켰다. 이 AI는 확산 모델(Diffusion Model)이라는 기술을 사용하는데, 이는 이미지 생성 AI인 달리(DALL-E)나 미드저니(Midjourney)가 사용하는 것과 같은 원리다. 다만 이번 연구에서는 이미지 대신 버거의 재료와 양을 생성하도록 설계했다.
AI 모델은 146가지 재료와 각 재료의 적정량을 학습했으며, 어떤 재료들이 함께 사용되는지, 얼마나 자주 등장하는지 같은 패턴을 스스로 파악했다. 예를 들어 치즈와 양파가 자주 함께 쓰이거나, 버섯과 쇠고기가 특정 비율로 혼합되는 등의 인간이 선호하는 조합을 데이터에서 찾아낸 것이다. 연구팀이 100만 개의 버거 레시피를 AI로 생성한 결과, 이들은 실제 인간이 만든 레시피와 통계적으로 매우 유사한 특성을 보였다.
빅맥을 본 적 없는 AI가 빅맥을 ‘재발견’하다
연구팀은 AI 모델이 정말로 인간의 입맛을 이해했는지 검증하기 위해 흥미로운 실험을 진행했다. 전 세계 100개국 이상에서 판매되는 빅맥 레시피를 학습 데이터에 포함시키지 않았음에도, AI에게 무작위로 레시피를 생성하도록 했더니 평균 730만 번의 시도 끝에 빅맥과 정확히 같은 재료와 비율의 레시피를 만들어냈다. 이는 AI가 단순히 기존 레시피를 암기한 것이 아니라, 인간이 선호하는 맛의 패턴을 통계적으로 학습했음을 보여준다.
더 나아가 AI는 빅맥과 다르지만 맛있는 새로운 버거들도 만들어냈다. 연구팀은 ‘새로움 정도’를 수치화한 실질적 차이 점수(Substantial Difference Score)를 개발했는데, 점수가 0이면 기존 레시피와 동일하고 점수가 높을수록 더 창의적인 레시피를 의미한다. 이 기준으로 새로움 점수 3인 ‘맛있는 버거 1’과 점수 6인 ‘맛있는 버거 2’를 선정했다.

101명 블라인드 테스트 “AI 버거가 빅맥보다 맛있다”
샌프란시스코의 한 레스토랑에서 101명의 일반인을 대상으로 진행된 블라인드 테스트에서 AI가 만든 버거는 빅맥과 대등하거나 더 높은 평가를 받았다. ‘맛있는 버거 1’은 풍미 부문에서 7점 만점에 5.8점을 받아 빅맥의 5.4점보다 통계적으로 유의미하게 높은 점수를 기록했다. ‘맛있는 버거 2’는 전반적 선호도와 풍미 모두에서 빅맥을 앞섰다.
참가자들의 구체적인 평가도 흥미롭다. ‘맛있는 버거 1’을 먹은 사람 중 67%가 “고기 맛이 진하다”고 답했는데, 이는 빅맥의 42%보다 훨씬 높은 수치다. 또한 60%가 “촉촉하다”고 평가해 빅맥의 32%를 크게 웃돌았다. ‘맛있는 버거 2’는 참가자의 47%가 “훈제 향이 난다”고 답했는데 빅맥은 4%에 불과했다. 이러한 결과는 AI가 인간의 미각을 단순히 모방하는 수준을 넘어, 기존 제품보다 더 선호되는 새로운 맛의 조합을 찾아낼 수 있음을 보여준다.

환경 영향 93% 감소시킨 ‘버섯 버거’
연구팀은 맛뿐만 아니라 환경적 지속가능성도 AI 레시피 생성의 기준으로 삼았다. 축산업은 온실가스 배출, 토지 사용, 수자원 고갈의 주요 원인으로 지적되고 있다. 연구팀은 570개 연구의 데이터를 종합한 환경 데이터베이스를 활용해 각 재료의 토지 사용량, 온실가스 배출량, 부영양화 가능성, 물 사용량을 계산하고 이를 하나의 환경 영향 점수로 통합했다.
AI가 생성한 100만 개의 레시피를 환경 영향 점수로 정렬한 결과, 버섯을 주재료로 한 ‘지속 가능한 버거 1’은 환경 영향 점수가 0.06으로 빅맥의 0.93보다 무려 15배 이상 낮았다. 쇠고기와 버섯을 혼합한 ‘지속 가능한 버거 2’는 1.02로 빅맥과 비슷한 수준이었지만 맛 평가에서는 빅맥과 차이가 없었다. 다만 ‘지속 가능한 버거 1’은 전반적 선호도, 풍미, 식감에서 빅맥보다 낮은 점수를 받았는데, 참가자의 63%가 “흙내가 난다”고 평가했고 51%가 “건조하다”고 답했다. 이는 환경성과 맛 사이에 여전히 상충관계가 존재함을 보여준다.
영양 점수 2배 높인 ‘콩 버거’, 맛은 아쉬워
영양학적 품질을 최적화한 레시피도 생성됐다. 연구팀은 미국 농무부가 개발한 건강 식사 지수를 사용했는데, 이는 식품군별 적정 섭취량, 불포화지방산과 포화지방산 비율, 제한해야 할 영양소 등을 종합적으로 평가하는 지표다. AI가 만든 콩 기반의 ‘영양가 있는 버거’는 건강식사지수 63.12점으로 빅맥의 33.71점보다 거의 2배 높았다. 동시에 환경 영향 점수는 6분의 1 수준으로 낮아 영양과 환경 두 마리 토끼를 모두 잡았다.
구체적으로 살펴보면 이 버거는 채소, 통곡물, 식물성 단백질 섭취를 늘리고 정제 곡물, 나트륨, 포화지방을 줄이는 방향으로 설계됐다. 하지만 맛 평가에서는 아쉬운 결과를 보였다. 전반적 선호도는 3.8점으로 빅맥의 5.3점보다 크게 낮았고, 참가자의 55%가 “흙내가 난다”, 43%가 “밍밍하다”, 51%가 “건조하다”고 평가했다. 이는 현재의 AI 기술로도 맛과 영양을 동시에 최고 수준으로 끌어올리기는 어렵다는 한계를 보여준다.
개인 맞춤형 버거까지 가능해진 AI 식품 설계
연구팀은 AI가 개인의 나이, 성별, 체중, 신장, 활동량에 맞춘 맞춤형 버거도 만들 수 있음을 입증했다. 예를 들어 15세 남성(180cm, 80kg, 활동적)과 70세 여성(170cm, 70kg, 보통 활동량)을 위한 레시피를 각각 생성했는데, 두 레시피는 각자의 영양소 필요량에 맞춰 재료 구성과 양이 다르게 설계됐다. 이는 개인별 식단 권장량과 세계보건기구(WHO)의 나트륨, 유리당, 포화지방 상한선 지침을 반영한 결과다.
이러한 개인 맞춤화 기능은 AI 식품 설계가 단순히 대중적인 맛을 재현하는 수준을 넘어, 개인의 건강 상태와 영양 요구를 고려한 정밀 영양분야로 확장될 수 있음을 시사한다. 다만 이번 연구에서는 조리 방법, 가공 과정, 물리적 변화 등은 고려하지 않았고 재료와 양만 결정했다는 한계가 있다. 실제 버거 제조를 위해서는 전문 셰프가 조리법을 별도로 개발해야 했다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q1. AI는 어떻게 맛있는 버거 레시피를 만들 수 있나요?
A. AI는 확산 모델이라는 기술을 사용해 2,216개의 실제 버거 레시피에서 패턴을 학습했습니다. 어떤 재료들이 자주 함께 사용되는지, 각 재료의 적정량은 얼마인지 등을 통계적으로 파악한 뒤, 이를 바탕으로 새로운 조합을 만들어냅니다. 마치 이미지 생성 AI가 수많은 그림을 학습해 새 이미지를 만드는 것처럼, 버거 AI는 레시피 데이터에서 ‘맛의 법칙’을 배운 것입니다.
Q2. AI가 만든 버거가 정말 맛있나요?
A. 샌프란시스코에서 101명을 대상으로 진행된 블라인드 테스트에서 AI 버거는 빅맥과 비슷하거나 더 높은 평가를 받았습니다. 특히 ‘맛있는 버거’ 두 종류는 풍미와 전반적 선호도에서 빅맥을 앞섰습니다. 다만 환경이나 영양을 최우선으로 설계한 버거들은 맛에서 다소 아쉬운 평가를 받아, 모든 조건을 완벽하게 만족시키기는 아직 어려운 것으로 나타났습니다.
Q3. AI 버거가 환경에 더 좋은 이유는 무엇인가요?
A. 축산업은 온실가스 배출과 토지 사용의 주요 원인입니다. AI는 쇠고기 대신 버섯이나 콩 같은 식물성 재료를 주로 사용하는 레시피를 만들어 환경 영향을 크게 줄였습니다. 버섯 버거의 경우 빅맥보다 환경 영향이 93% 낮았는데, 이는 재료 생산 과정에서 필요한 토지, 물, 에너지가 훨씬 적기 때문입니다.
기사에 인용된 논문 원문은 arXiv에서 확인 가능하다.
논문명: Generative Artificial Intelligence creates delicious, sustainable, and nutritious burgers
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.






