인간의 손이 왜 그토록 정교한지, 그 비밀이 로봇 연구실에서 수치로 증명됐다. 싱가포르국립대(NUS), 푸단대 등 6개 기관 공동 연구팀이 2026년 3월 공개한 논문에서 로봇의 촉각 신호를 대규모로 분석한 결과, 촉각 데이터에는 지금껏 명시적으로 규명되지 않았던 두 가지 구조적 법칙이 존재한다는 사실이 밝혀졌다. 연구팀은 이 발견을 토대로 기존 최고 성능 방식을 큰 폭으로 앞서는 로봇 조작 프레임워크 ‘OmniVTA’를 구현했다. 단순한 성능 개선이 아니라, 촉각이 어떻게 작동하는지에 대한 근본적인 이해가 바뀐 연구다.

촉각 신호에는 두 가지 물리 법칙이 있다
연구팀이 2만 1,879개의 로봇 조작 궤적 데이터를 분석한 결과, 촉각 신호에는 두 가지 일관된 구조적 특성이 존재했다.
첫 번째는 ‘공간 국소성(spatial locality)’이다. 로봇 손가락이 물체와 접촉할 때 촉각 센서 전체가 반응하는 게 아니라, 실제 접촉이 일어나는 극히 일부 영역에서만 의미 있는 신호가 발생한다는 것이다. 조립이나 잡기, 자세 조정처럼 정밀한 작업에서는 전체 센서 면적의 0~10% 범위에만 접촉이 집중됐다.
두 번째는 ‘접촉 주도 역학(contact-driven dynamics)’이다. 촉각 신호의 변화는 로봇 팔의 움직임이 아닌, 물체와의 물리적 접촉 여부에 의해 결정된다는 것이다. 접촉이 없는 동안 촉각 센서는 거의 반응하지 않다가, 물체에 닿는 순간 신호 패턴이 급격히 변한다.
이 두 가지 특성은 기존 연구에서 암묵적으로 가정되어 왔지만, 대규모 다중 작업 데이터를 통해 수치로 입증된 것은 이번이 처음이다. 연구팀은 이 발견이 곧바로 촉각 AI 설계 원칙의 변화로 이어진다고 강조했다.
촉각 예측 정확도 60% 아래로 떨어지면 로봇은 판단력을 잃는다
연구에서 가장 충격적인 발견 중 하나는 촉각 예측 정확도와 로봇 성능 사이에 임계점(tipping point)이 존재한다는 사실이다. 연구팀은 의도적으로 예측 정확도를 100%, 80%, 60%, 40%, 20%로 낮춰가며 실험했다. 예측 정확도가 80%일 때는 성공률이 소폭 하락하는 수준이었지만, 60% 아래로 떨어지는 순간 로봇은 접촉이 일어날 가능성 자체를 제대로 추정하지 못했다.
그 결과 시각 정보와 촉각 정보 중 어느 쪽에 더 의존해야 할지 판단하는 능력이 무너졌고, 작업 성공률이 급격히 떨어졌다. 닦기 작업을 예로 들면, 예측이 정확할 때 66%였던 성공률이 예측 정확도 20% 수준에서는 거의 0에 가까워졌다.
이는 촉각 예측이 단순히 성능을 높이는 부가 기능이 아니라, 로봇 판단 구조 전체를 떠받치는 핵심 축임을 보여준다. 예측이 틀리면 어떤 감각을 믿어야 할지 모르는 인간처럼, 로봇도 방향을 잃는다.
시각 예측을 추가해도 성능은 오르지 않는다
직관에 반하는 또 하나의 발견이 있다. 미래의 시각 정보를 함께 예측해 정책에 입력하면 더 잘 작동하리라는 기대와 달리, 시각 예측 추가는 성능 향상으로 이어지지 않았다. 닦기와 껍질 벗기기 두 작업의 평균 성공률을 비교했을 때, 촉각 예측만 사용한 경우와 시각 예측을 함께 사용한 경우가 각각 53%와 54%로 사실상 동일했다. 반면 시각 예측 모듈을 추가하자 추론 시간은 230밀리초에서 480밀리초로 두 배 이상 늘어났다.
연구팀은 현재 시각 정보가 이미 충분한 전역 맥락을 제공하는 반면, 미래의 접촉 역학은 촉각 예측이 훨씬 효과적으로 포착한다고 분석했다. 눈이 현재 상황을 파악하고, 손끝이 앞으로의 변화를 예측하는 분업이 실제로도 최적의 전략인 셈이다.
촉각 패턴은 물리 법칙에 따라 명확하게 나뉜다
연구팀은 6가지 작업 카테고리에서 수집한 촉각 신호 전체를 2차원 지도로 시각화했다. 고차원 데이터를 저차원으로 압축하는 t-SNE 기법을 적용한 결과, 촉각 패턴은 물리적 접촉 방식에 따라 명확하게 분리된 군집을 형성했다.
지속적인 마찰과 고주파 동적 힘이 수반되는 닦기와 껍질 벗기기는 서로 인접한 군집을 형성했고, 정적 압력과 정밀 기하학적 접촉이 지배하는 조립은 뚜렷하게 분리된 영역을 차지했다. 잡기 카테고리는 섬세한 물체 처리부터 복잡한 관절 구조물 조작까지 다양한 힘 프로파일을 포함하기 때문에 가장 넓은 영역에 퍼진 군집을 보였다.
이 분석은 촉각 데이터가 노이즈가 많은 임의적 신호가 아니라, 물리 법칙을 따르는 구조화된 정보임을 시각적으로 증명한다. 같은 방식으로 접촉하면 같은 패턴이 나온다는 이 발견은, 로봇이 한 번도 본 적 없는 새 도구나 물체를 다룰 때도 학습한 원리를 적용할 수 있다는 일반화 가능성의 근거가 된다.
FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q. ‘공간 국소성’과 ‘접촉 주도 역학’, 이 두 가지 발견이 왜 중요한가요?
이 두 가지 특성은 촉각 AI를 설계할 때 어디에 집중해야 하는지를 알려주는 원칙입니다. 센서 전체를 균일하게 처리하는 대신 접촉이 일어나는 국소 영역에 집중하고, 시간 흐름보다 접촉 이벤트를 기준으로 신호를 해석하면 훨씬 효율적이고 정확한 로봇 제어가 가능합니다.
Q. 촉각 예측 정확도에 임계점이 있다는 건 실제로 어떤 의미인가요?
로봇이 미래 접촉 상태를 어느 정도 이상 정확하게 예측하지 못하면, 시각과 촉각 중 어느 감각을 더 믿어야 할지 판단하는 메커니즘 자체가 무너진다는 뜻입니다. 단순히 성능이 조금 낮아지는 게 아니라 판단 능력이 급격히 붕괴하는 임계 구간이 존재하므로, 촉각 예측 모델의 품질 관리가 매우 중요합니다.
Q. 이 연구가 앞으로의 로봇 기술에 어떻게 영향을 줄 수 있나요?
촉각 신호의 구조적 법칙이 규명됨에 따라, 제조업·수술 로봇·서비스 로봇 등 정밀한 물리 접촉이 필요한 분야에서 AI 설계 방향이 바뀔 수 있습니다. 연구팀은 데이터셋과 모델 전체를 공개할 예정이어서, 후속 연구와 산업 적용이 빠르게 이루어질 것으로 기대됩니다.
기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.
리포트명: OmniVTA: Visuo-Tactile World Modeling for Contact-Rich Robotic Manipulation
이미지 출처: AI 생성 콘텐츠 해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.



![[AI와 인간 사이] 앤트로픽의 하네스 유출은 코딩의 패러다임을 바꾸고 있다](https://aimatters.co.kr/wp-content/uploads/2026/04/AI와-인간-사이-앤트로픽의-하네스-유출은-코딩의-패러다임을-바꾸고-있다.png)



