• Home
  • AI Report
  • 텍스트 입력만으로 실제 로봇 만드는 AI 기술 등장… “몇 분 만에 설계하고 하루 안에 제작 가능”

텍스트 입력만으로 실제 로봇 만드는 AI 기술 등장… “몇 분 만에 설계하고 하루 안에 제작 가능”

Text2Robot: Evolutionary Robot Design from Text Descriptions
이미지 출처: Text2Robot: Evolutionary Robot Design from Text Descriptions

Text2Robot: Evolutionary Robot Design from Text Descriptions


몇 분 만에 설계, 하루 만에 걷는 로봇 제작… Text2Robot의 혁신적 접근법

로봇 설계는 반세기 이상 비용이 많이 들고 노동 집약적인 과정이었다. 초기 스케치부터 상세 모델링, 프로토타이핑, 컨트롤러 설계, 제조 및 테스트에 이르기까지 광범위한 인력이 필요했다. 이런 전통적 접근 방식은 비용 부담, 긴 개발 주기, 인간 상상력과 수동 작업 능력에 제한된 혁신 등 여러 한계점을 가진다.

듀크 대학교(Duke University) 연구팀이 개발한 ‘Text2Robot’은 이러한 문제를 해결하는 혁신적인 접근법을 제시했다. 사용자가 텍스트로 입력한 사양과 성능 선호도에 따라 물리적 네 발 로봇을 설계하고 제작하는 프레임워크다. 텍스트 기반 3D 모델을 활용해 단 몇 분 만에 다양한 형태의 강력한 초기 설계를 제공하며, 하루 이내에 실제 전자 부품과 제조 가능성을 고려한 걷는 로봇을 제작할 수 있다.


로봇 설계에 수개월 소요… 비용과 시간의 한계 타파할 자동화 기술 필요

로봇 설계 자동화의 주요 도전 과제는 광대하고 복잡한 설계 공간을 탐색하는 것이다. 전통적인 엔지니어링 설계는 시간이 많이 소요되고 상당한 기술적 전문성이 필요하다. 제어 엔지니어링과 기계 학습 분야의 발전으로 로봇 정책 자동 훈련이 가능해졌지만, 형태 설계는 여전히 노동 집약적이다.

인간 설계자는 일반적으로 비용, 제조 가능성, 성능 등을 고려하여 로봇을 개념화하고 설계하고 제작하는 데 수개월을 소비한다. 기존의 자동화 시도는 대형 반복 모듈이나 복셀 표현을 사용하여 설계 공간을 단순화하는 경우가 많았다. 그러나 이러한 방식은 방대한 설계 공간 내에서 검색해야 하기 때문에 속도가 느리고 실제 제작을 고려하지 않아 이론적으로는 그럴듯하지만 실제로 생산하기 어려운 설계가 나오곤 했다.

무작위 솔루션에서 수백 세대 반복… 기존 진화 알고리즘의 느린 진행 속도

로봇 설계 자동화는 주로 자연 진화에서 영감을 받은 진화 알고리즘(Evolutionary Algorithms, EA)을 사용한다. 그러나 EA 기반 접근법은 본질적으로 느리며, 무작위 솔루션에서 시작하여 수백 세대를 거쳐 반복한다. 또한 기존 솔루션은 설계 복잡성이 증가함에 따라 확장성이 떨어지고 제어 및 형태 동시 최적화와 같은 여러 목표의 균형을 맞추는 데 큰 어려움을 겪는다.

결과적으로 이러한 솔루션은 시뮬레이션에서는 우수할 수 있지만 현실 세계 적용(sim2real transfer)과 제조 가능성 같은 실질적인 문제를 해결하지 못하는 경우가 많다. 비현실적인 자유도에서 높은 전류 소모나 제조하기 어려운 복잡한 형태 같은 문제가 이론적 설계에서 실용적이고 생산 가능한 로봇으로의 전환을 방해한다.

“A-to-Z” 프레임워크로 사용자 텍스트에서 물리적 로봇까지 완성

Text2Robot은 사용자 텍스트 사양에서 물리적 보행 로봇까지 이르는 “A-to-Z” 프레임워크다. 이 접근법은 최근 텍스트-3D 생성 모델의 발전을 활용하여 초기 메시 설계를 생성하고, 이후 기하학적 처리 알고리즘을 통해 운동 로봇 모델로 변환한다.

단 몇 분 만에 설계를 생성할 수 있으며, 1시간 내에 시뮬레이션에서 훈련된 로봇을, 하루 내에 제작된 보행 로봇을 만들 수 있다. 이 시스템은 사용자의 미적 선호도를 충족시킬 뿐 아니라 진화 알고리즘을 사용하여 다른 성능 선호도를 통합하도록 설계를 최적화한다.

핵심 통찰은 텍스트-3D 생성 모델이 진화 알고리즘에 훨씬 강력한 출발점을 제공하여 최적화 과정을 크게 가속화할 수 있다는 점이다. 시뮬레이션과 물리적 세계 모두에서의 실험은 속도 추적 및 에너지 효율성과 같은 미적 품질과 성능 지표를 모두 지정할 수 있는 능력을 보여준다.

Text2Robot Evolutionary Robot Design from Text Descriptions


비교 실험 결과: Text2Robot, 기존 방식보다 ‘큰 차이로’ 성능 우수

Text2Robot의 핵심 장점 중 하나는 텍스트-3D 모델을 통합하여 진화적 설계에 훨씬 강력한 초기화를 제공한다는 점이다. 연구팀은 단순한 기본 기하학을 기반으로 한 다양한 대칭 로봇 설계를 가능하게 하는 RoboGrammar와 비교했다.

결과는 Text2Robot의 초기화된 로봇이 비교 대상 초기화 로봇보다 큰 차이로 성능이 우수함을 보여줬다. RoboGrammar 로봇의 대부분은 관절과 링크의 부자연스러운 배치와 방향으로 어려움을 겪었다. 같은 쪽의 사지가 너무 가까이 있어 균형을 해치고, 링크가 관절 축과 같은 방향으로 돌출되어 사지가 이동에 효과적이지 못했다.

반면 Text2Robot은 텍스트-3D 생성 모델에 내장된 물리적 세계에 대한 지식을 활용하여 적절한 다리 길이, 링크 및 몸체 비율, 안정적인 정적 초기 자세를 갖춘 네 발 로봇을 생성했다.

‘버그’, ‘개구리’, ‘개’ 형태 실험…단 몇 세대 만에 성공적 이동 구현

연구팀은 “버그(Bug)”, “개구리(Frog)”, “개(Dog)” 등 유사한 형태를 가진 로봇의 형태와 제어를 동시 최적화했다. 각 종은 유사한 프롬프트에서 다섯 가지 형태 변형을 포함한다. 실험 결과, 성공적인 이동이 단 몇 세대 내에 나타나 Text2Robot 방법의 효율성을 입증했다.

또한 로봇 다양성 증가의 효과도 조사했다. 16개 프롬프트와 버그 종의 추가 4개 프롬프트에서 확장된 600개 로봇을 사용했다. 최종 선택된 로봇은 유사한 형태로 최적화된 로봇보다 높은 보상을 달성했다. Text2Robot은 텍스트 설명의 다양성을 확장함으로써 더 높은 품질의 설계를 가능하게 한다.

이는 이 방법이 더 다양하고 창의적인 텍스트 프롬프트로 확장하여 더 나은 성능을 달성할 수 있는 잠재력을 보여준다.

에너지 vs 속도: 사용자 우선순위 반영한 맞춤형 로봇 설계 가능

Text2Robot은 사용자가 제공한 우선순위(에너지 효율성 또는 속도 추적)에 따라 로봇 설계를 최적화하는 능력도 평가됐다. 연구팀은 각 보상에 추가 증폭된 에너지나 속도 기여도를 조정하여 적합도 점수 계산을 조정했다. 단일 종이나 다양한 종의 로봇 최적화에서 이 방법은 성능 우선순위를 고려하면서 세대별 로봇 성능을 최적화할 수 있었다. 결과는 최고 성능 로봇과 목표 성능 기준 사이에 강한 상관관계를 보여주었으며, 최적화되지 않은 다른 성능 기준은 더 무작위적이고 산발적으로 나타났다.

속도 최적화에서 선택된 로봇은 일반적으로 더 길고 넓은 몸체를 가진 반면, 에너지 최적화에서 선택된 로봇은 몸체 무게가 더 낮았다. 또한 다양한 로봇 뱅크의 성능이 단일 종 뱅크보다 우수하여 이 방법의 확장성을 보여줬다.

지형에 따라 발 모양도 진화: 평지엔 ‘아치형’, 거친 지형엔 ‘둥근 발’

Text2Robot을 거친 지형에 적용한 결과, 더 높은 성능의 발 모양으로 진화된 로봇 형태에 효과적으로 영향을 미쳤다. 또한 입력 텍스트가 몸체 구성요소뿐만 아니라 발 모양과 같은 로봇 설계의 세부 사항에 미치는 영향도 강조했다. 선택된 로봇 형태 분석 결과, 발 모양과 지형 유형 사이에 상관관계가 있음이 밝혀졌다. 평평한 지형 실험에서 선호되는 아치형 발은 곡률 덕분에 안정성, 속도, 효율적인 에너지 전달이 향상되었다. 그러나 이 이점은 예측 가능한 표면 접촉 역학에 달려 있다.

아치형 발의 큰 치수는 고르지 않은 지형에서 걸림 위험을 증가시킨다. 반면에 거친 지형에 선택된 단순한 둥근 발은 예측할 수 없는 표면에 대한 적응성이 뛰어나 안정성과 균형을 촉진했다.

시뮬레이션에서 현실로: 목표 속도 0.1m/s로 실제 걷는 로봇 구현

연구팀은 단일 종 최적화에서 가장 성능이 뛰어난 “버그”와 “개구리”, 그리고 속도 추적과 에너지 효율성에 최적화된 다양한 뱅크의 두 로봇을 선택하여 생성된 설계를 제작할 수 있는 능력을 입증했다. 각 로봇은 제조에 약 하루가 소요되었지만, 조립은 몇 분 내에 완료됐다. 연구팀은 시뮬레이션에서 훈련된 이동 정책을 간단히 실행하고 실제 로봇에서 관절 위치를 직접 실행하여 기본적인 시뮬레이션-현실 전환(Sim2Real transfer)을 보여줬다.

실제 로봇은 시뮬레이션에서 학습한 걷기 정책을 실제 세계로 성공적으로 전환하여 이동과 속도에서 충분한 성능을 달성했다. 이는 Text2Robot 파이프라인에서 나온 설계의 실용성과 견고성을 더욱 검증한다.

미래 전망: 다양한 관절 수와 자동 조립 기술로 발전 가능성

Text2Robot은 텍스트 프롬프트에서 사용자가 지정한 미적 및 성능 선호도에 맞는 물리적 네 발 보행 로봇을 생성한다. Text2Robot은 생성 모델을 활용하여 기존 방법보다 더 강력한 초기화를 제공하면서, 전자 부품과 실제 세계 제조 가능성을 고려하여 시각적 메시를 움직이는 로봇으로 변환한다.

현재 Text2Robot은 인간이 설계하기에도 이미 까다로운 네 발 로봇에 초점을 맞추고 있지만, 향후 연구는 다양한 관절 수를 가진 로봇이나 다른 유형의 전기기계 기계로 범위를 확장할 수 있다. 한 가지 가능한 해결책은 Text2Robot의 강력한 초기화를 RoboGrammer와 같은 기존 로봇 설계 방법과 결합하는 것이다.

또한 현재 프레임워크는 여전히 수동 조립이 필요하다. 물리적 로봇을 구성하기 위한 자동화된 조립 알고리즘과 이 방법을 통합하는 것은 중요한 발전이 될 것이다. 그리고 최적화가 시작되면 현재 텍스트 프롬프트는 고정된 상태로 유지된다. 보상 신호에 기반하여 텍스트-3D 모델의 메시 생성을 개선하는 피드백 메커니즘을 탐색하면 더 큰 유연성을 제공할 수 있을 것이다.

FAQ

Q: Text2Robot이 무엇이며 기존 로봇 설계 방식과 어떻게 다른가요?

A: Text2Robot은 사용자가 텍스트로 입력한 설명에서 물리적 네 발 로봇을 설계하고 제작하는 프레임워크입니다. 기존 방식이 수개월이 걸리는 노동 집약적 과정인 반면, Text2Robot은 몇 분 만에 초기 설계를 생성하고 하루 내에 걷는 로봇을 제작할 수 있습니다. 텍스트-3D 생성 모델을 활용해 진화 알고리즘에 강력한 시작점을 제공하는 것이 핵심 차별점입니다.

Q: 텍스트 입력이 어떻게 실제 로봇으로 변환되나요?

A: 사용자가 1-3단어로 로봇 설명을 입력하면 텍스트-3D 모델(Meshy)이 이를 처리해 3D 메시를 생성합니다. 이후 기하학적 처리 알고리즘이 정적 메시를 관절 위치, 전자 부품 배치 등이 포함된 운동 로봇 모델로 변환합니다. 진화 알고리즘과 강화 학습을 통해 형태와 걷기 정책을 사용자 선호도에 맞게 최적화한 후 3D 프린팅으로 제작합니다.

Q: 일반인도 Text2Robot을 사용해 로봇을 만들 수 있나요?

A: 현재 Text2Robot은 연구 단계에 있으며 네 발 로봇과 8개 모터라는 특정 제약 조건 내에서 연구되었습니다. 그러나 이 기술이 발전하면 일반인도 텍스트 설명만으로 로봇을 설계하고 제작할 수 있는 도구로 발전할 가능성이 있습니다. 미래에는 더 다양한 로봇 유형과 복잡성을 지원하고 사용자 친화적인 인터페이스를 갖출 것으로 기대됩니다.

해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: Text2Robot: Evolutionary Robot Design from Text Descriptions

기사는 클로드와 챗GPT를 활용해 작성되었습니다. 




텍스트 입력만으로 실제 로봇 만드는 AI 기술 등장… “몇 분 만에 설계하고 하루 안에 제작 가능” – AI 매터스