피지컬 AI 구현 위한 ‘강화학습’ 한계 극복
SISL·SSE·S2Q 기술 제시해 논문 3편 채택
울산과학기술원(UNIST)가 인공지능(AI)대학원 한승열 교수팀이 표현학습국제학회(ICLR 2026)에서 논문 세 편이 동시에 채택되는 성과를 거뒀다고 21일 밝혔다. ICLR은 신경정보처리시스템학회(NeurIPS), 국제머신러닝학회(ICML)와 함께 ‘세계 3대 AI 학회’로 꼽힌다.
채택된 세 논문에는 각각 이상현, 황재박, 조용현 연구원이 제1저자로 참여했으며 모두 차세대 피지컬 AI 기술의 핵심인 강화학습 분야에서 연구 성과를 냈다. 강화학습은 AI가 환경과 상호작용하며 시행착오를 통해 최적의 행동을 스스로 찾아내는 학습 방식이다. 로봇이나 자율주행차가 불확실하고 예측 불가능한 현실 물리 환경에 직접 부딪히며 상황을 인지하고 돌발 변수에 대처하도록 만드는 것 등이 강화학습에 해당한다.
한 교수팀은 산업 현장에서 바로 수집한 오프라인 데이터로도 AI를 효과적으로 학습시킬 수 있는 ‘자기 개선 스킬 학습법(SISL)’ 기술, 로봇의 복잡한 작업 성공률을 높일 수 있는 ‘엄격한 하위 목표 실행(SSE)’ 학습 기술, 여러 AI 에이전트가 협력하는 다중 에이전트 강화학습(MARL) 환경에서의 최적화 문제를 해결하기 위한 ‘연속적 하위 가치 Q-러닝(S2Q)’ 기술 등 3가지 기술을 각 연구 결과로 제시했다.
한 교수는 “이번 연구는 제한된 데이터와 불확실한 환경에서도 강화학습을 안정적으로 적용할 수 있는 가능성을 보여준 것”이라며 “자율주행·로봇·스마트제조 등 다양한 분야로의 확장이 기대된다”고 전했다.