로봇 훈련의 핵심은 데이터의 양이나 복잡성이 아닌 '일관성'에 있다는 연구 결과가 나왔다.

미국 뉴욕대(NYU) 탠던 공대와 로보틱스·AI 연구소 공동 연구팀은 일관성 있는 데이터로 훈련한 로봇이 사람처럼 정교한 손동작을 훨씬 효과적으로 학습한다는 연구 결과를 국제학술지 'IEEE 로보틱스 및 자동화 레터'에 발표했다고 4일(현지시간) 밝혔다. 이 논문은 해당 학술지의 최우수 논문으로 선정됐다.

지금까지 로봇의 정교한 동작 훈련은 주로 사람이 원격으로 조종하는 모습을 로봇이 따라 하는 '모방 학습'에 의존해왔다. 하지만 사람이 여러 접점을 동시에 제어하며 시연하기 어려운 한계가 있었다.

이를 극복하기 위해 연구팀은 사람이 아닌 '동작 계획 알고리즘'을 이용해 가상 환경에서 훈련용 데이터를 자동으로 생성했다. 그러나 기존의 '빠르게 탐색하는 임의 트리(RRT)' 알고리즘은 같은 목표에 대해서도 매번 다른 움직임을 생성해 데이터의 일관성이 부족했고, 이는 로봇의 학습 효율을 떨어뜨렸다.

논문의 제1 저자인 화이지앙 주 연구원은 "기존 방식은 해결책을 찾는 데는 뛰어나지만, 해결책마다 모습이 달라지면 학습 시스템이 어떤 행동을 모방해야 할지 혼란을 겪는다"고 설명했다.

연구팀은 이 문제를 해결하기 위해 임의 탐색보다 목표를 향한 꾸준한 진행을 강조하거나, 미리 정의된 동작 라이브러리를 재사용하는 방식으로 일관성 높은 데이터를 생성하는 새로운 접근법을 개발했다.

연구팀은 두 가지 실험을 진행했다. 양팔 로봇이 큰 원통을 180도 회전시키는 작업과, 로봇 손이 손바닥 안의 큐브를 목표 방향으로 맞추는 작업이었다.

그 결과, 일관성 있는 데이터로 훈련한 로봇은 기존 방식으로 훈련된 로봇보다 훨씬 높은 성공률을 보였다. 특히 양팔 로봇은 단 100회의 시뮬레이션 훈련만으로 실제 실험에서 90%의 성공률을 기록했다. 로봇 손의 경우 약 62%의 성공률을 달성했다.

이번 연구는 전통적인 로봇 동작 계획과 최신 머신러닝 기술을 결합하는 최근 연구 흐름을 보여준다. 또한 인공지능 분야 전반에서 데이터의 양보다 잘 정제된 '질 좋은 데이터'가 기계 학습에 더 효과적일 수 있다는 점을 시사한다.