UNISTUNIST

ADMISSIONS

발전기금
모바일메뉴 열기
 

UNIST site map

전체 메뉴 닫기
STUDENT
 
Scroll Down

UNIST Today

we are all

pioneers!

UNIque & beST

Nexus

UNIST Today

we are all

pioneers!

UNIque & beST

Nexus

Information for UNISTar

WHY UNIST

star

Global
Campus for
Future
Innovators

Research AREA

중점연구분야

Research
AREA

에너지·AI·미래산업에 집중하다

UNIST는 에너지 전환, AI, 미래산업이라는
대한민국의 핵심 과제에 연구 역량을 집중합니다.

  • 에너지 전환
  • 이차전지 · 수소 · 탄소중립
  • Ai 기반 산업 혁신
  • 반도체 · 소재 · 양자
EDUCATION INNOVATION

교육혁신프로그램

EDUCATION
INNOVATION

이론을 배우는 것을 넘어 직접
연구하며 성장하다

UNIST의 학부생부터 대학원생까지 연구의
보조가 아닌 주체로 성장하는 경험을 제공합니다.

  • 학부생 연구참여
  • 국제학회·논문참여
  • 소수정예 밀착 연구지도
industry collaboration

산학협력

industry
collaboration

연구에서 산업까지, 현장과 가장
가까운 UNIST

대한민국 최대 산업도시 울산에 위치한
UNIST는 연구 성과가 기업과 산업 현장으로
가장 빠르게 연결되는 구조를 갖추고 있습니다.

  • 기술사업화·창업지원
  • 울산 산업단지
  • 대기업 · 공기업과의 공동연구
Research support

연구지원

Research
support

젊은 UNIST, 연구에 최적화된
유연한 캠퍼스

UNIST는 가장 늦게 출범한 과기원으로,
관행에 얽매이지 않는 유연한 연구·교육 시스템을
갖추고 있습니다.

  • 빠른 신흥 분야 대흥
  • 단일 캠퍼스 기반
  • 생활.연구 일체형 구조
  • 개방형 연구 공간

Research Impact

star

“60초에 하나씩 초고속 마이크로 3D 프린팅”...디스펜싱 체적 프린팅 개발

60초마다 3차원 마이크로 구조물을 연속적으로 인쇄할 수 있는 새로운 체적 적층 제조 기술이 개발됐다. UNIST 기계공학과 정임두 교수팀은 3차원 인쇄를 한층 단위가 아닌 불륨 단위로 하고, 연속 공정으로 다양한 형상을 빠르게 제조할 수 있는 ‘디스펜싱 체적 3D 제조(Dispensing Volumetric Additive Manufacturing)’ 기술을 개발했다고 29일 밝혔다. 개발된 디스펜싱 체적 3D 프린팅 기술은 피펫 끝에 맺힌 액체 원료 방울에 빛을 쏴 원하는 모양대로 굳혀(경화) 형상을 만드는 방식이다. 형상이 다 경화되면 공기압으로 피펫에서 액체 방울을 밀어내고, 새로운 액체 방울을 만든다. 한 층씩 쌓아 올려 형상을 만드는 일반적인 3D 프린팅 기술(layer-by-layer)과 달리 한 번에 형상 전체 볼륨을 만들 수 있어 제작 시간을 크게 단축할 수 있고, 층을 매끄럽게 다듬기 위한 별도의 후처리도 필요 없다. 기존에도 형상을 한 번에 만드는 체적 3D 프린팅 기술들이 있었지만, 체적 3D 프린팅 기술 중 하나인 회전 축 리소그래피(Computed Axial Lithography, CAL)는 매 인쇄 주기마다 원통형 용기에 수지를 채우고, 균일한 조사를 위해 굴절률 매칭 용액을 사용하며, 인쇄된 물체를 용기로부터 꺼내야 하는 작업이 필요해 다수 부품을 연속적으로 대량 생산하기 어려웠다. 연구팀은 수지가 담긴 별도의 용기 대신 유리 피펫에서 분사되는 단일 수지 방울 내에서 인쇄와 배출이 이루어지는 DVAM 기술을 개발해 이 문제를 해결했다. 수지 방울 자체가 인쇄 볼륨 역할을 하며, 회전하는 동안 단면 조사를 통해 용기와 굴절률 매칭 매질 없이도 수지 전체를 균일하게 경화시킬 수 있다. 인쇄 후 경화된 구조물은 기판 위로 배출되며, 다음 방울이 즉각적으로 공급돼 고속 연속 생산이 가능하다. 기술 개발의 가장 큰 난관은 액적의 둥근 표면 때문에 생기는 빛의 굴절이었다. 연구팀은 인공지능과 역 광선 추적의 광학 계산 기술을 결합해 이를 해결했다. 딥러닝 기반 사물 인식 AI가 액적의 곡률과 윤곽을 실시간으로 인식하면, 이를 바탕으로 빛의 굴절 경로를 계산하여 왜곡 및 경화에 필요한 에너지를 미리 수학적으로 보정한 패턴을 투사한 것이다. 이를 바탕으로 ‘에펠탑’이나 ‘생각하는 사람’과 같은 복잡한 구조를 프린팅할 수 있으며, 프린팅 시간 및 프린팅 외 작업 시간을 포함해서 10분 안에 각기 다른 10개 형상들을 제조할 수 있다. 구조물 하나를 만드는데 걸리는 시간은 60초 내외였다. 제 1 저자로 참여한 전홍령 학생은 “기존 3D 프린팅 원리와는 다르게 전체 형상을 볼륨 단위로 한번에 경화시키고, 또한 별도의 추가 공정없이 연속으로 바로 디스펜싱하도록 하여 3D 프린팅 속도를 백배 이상 향상 시켰다”며, “서로 다른 형상의 3차원 마이크로 부품을 쾌속으로 대량 생산할 수 있는 가능성을 보여주었다”고 했다. 연구를 총괄한 교신 저자인 정임두 교수는 “맞춤형 제조가 가능한 3D 프린팅 기술의 경우 느린 제조 속도가 항상 단점으로 지적되는데, 기존 광경화 방식에서 벗어나 전체 볼륨을 한번에 생산하고, 이때 발생하는 광학적 왜곡 한계를 인공지능 기술로 해결함으로써 초고속 3D 프린팅의 가능성을 한 단계 끌어올린 사례”라며, “이제는 원하는 형상을 제조하기 위해 오래 기다릴 필요 없이, 즉석에서 수십초 내에 만들 수 있는 시대가 되었다“고 했다. 연구 결과는 재료 과학 분야 세계적 학술지 (Impact Factor: 19.0, JCR 상위 5% 이내)인 ‘어드밴스드 펑셔널 머티리얼즈(Advanced Functional Materials)’에 3월 21일 온라인으로 게재되었다. 연구 수행은 과학기술정보통신부 한국연구재단과 정보통신기획평가원 및 산업통상자원부의 기술개발사업 지원으로 이뤄졌다.

2026.05.11

  • 3D 프린팅
  • layer-by-layer
  • 리소그래피
  • 액적프린팅
  • 체적3D프린팅
  • 회전축리소그래피

몸 안의 면역 센서 깨우는 헤르페스 바이러스 DNA의 바코드 발견!

헤르페스 바이러스가 활성화될 때 입술 주변에 올라오는 염증은 바이러스에 감염된 세포를 제거하려는 면역 반응의 결과다. 이 과정에서 우리 몸의 선천 면역 센서인 AIM2가 작동하게 되는데, 이 센서가 바이러스 DNA의 반복 코드를 인식함으로써 염증 반응과 감염 세포 사멸을 유도하는 것으로 드러났다. UNIST 생명과학과 이상준 교수팀은 성균관대, 제주대, IBS 한국바이러스기초연구소와의 공동연구를 통해 헤르페스 바이러스 DNA 상의 ‘poly(T)’ 반복 서열이 면역 반응을 유도한다는 사실을 규명했다고 27일 밝혔다. 헤르페스 제1형 바이러스는 전 세계 인구의 약 67%가 감염돼 있을 정도로 흔한 바이러스이다. 평소에는 면역계의 공격이 어려운 신경절에 숨어 있다가 면역 감시가 느슨해진 틈을 타 숙주 피부 세포를 감염시킨다. AIM2는 방어를 위해 출동한 숙주 대식세포 안에서 바이러스를 감지하는 센서 역할의 단백질이다. 연구에 따르면, AIM2는 바이러스 DNA 중 티민(T) 염기 분자가 길게 반복된 poly(T) 구간을 인식해 바이러스를 감지한다. 똑같은 제1형 헤르페스 바이러스라도 균주별로 면역 반응 강도가 달랐는데, 균주 DNA상에 poly(T) 서열이 있는 경우에만 AIM2가 활성화되며 염증 반응과 감염 세포 사멸이 일어난 것이다. 반대로 이 서열이 없거나 티민 염기 분자 20개 미만의 짧은 구간만 가진 균주에서는 이러한 반응이 거의 나타나지 않았다. 다른 균주에 이 서열을 넣어주면 면역 반응이 새롭게 유도됐으며, 반복 서열의 길이가 길수록 반응이 강해지는 ‘길이 의존성’도 확인됐다. 또 동물 실험에서 poly(T) 반복 서열이 있는 바이러스에 감염된 경우 염증 반응이 유도되며 바이러스 증식이 억제된반면, 이 서열이 제거된 바이러스에 감염되면 면역 반응이 거의 일어나지 않고 바이러스가 빠르게 증식해 치명적인 감염으로 이어졌다. 연구팀은 이 poly(T) 반복 서열이 엠폭스바이러스, 아데노바이러스, 코로나바이러스 등 다양한 감염병 바이러스군에서도 폭넓게 보존되어 있다는 점도 방대한 유전체 데이터 분석을 통해 찾아냈다. 이상준 교수는 “인체 면역 센서가 생각보다 훨씬 정교하게 바이러스를 인식한다는 사실을 새롭게 밝혔다”며 “바이러스 자체를 직접 공격하는 치료법이 아닌 면역 센서의 활성도를 조절하는 치료법이 새로운 대안으로 주목받고 있는데, 이번 발견은 이러한 맞춤형 면역 조절 신약 개발의 이론적 토대가 될 것”이라고 말했다. 이 교수는 이어 “이번에 확인된 반복 서열은 헤르페스뿐만 아니라 중증 질환을 유발하는 다양한 감염병 바이러스에서도 공통으로 보존되어 있기 때문에, 실제 환자의 질병 중증도와 바이러스 유전체 서열의 연관성을 추가로 규명해 다양한 감염병의 치료 전략을 설계하는 데 도움이 될 것”이라고 덧붙였다. 이번 연구는 성균관대학교 이주상 교수, 제주대학교 김의태 교수, 기초과학연구원 한국바이러스기초연구소 최영기 소장팀과의 공동 연구를 통해 수행된 융합 연구 성과이며, 연구 결과는 국제학술지 네이처 커뮤니케이션즈(Nature Communications)에 4월 13일 온라인 게재됐다. 연구 수행은 한국연구재단(NRF) 우수신진연구사업, 국가신약개발사업(KDDF), 보건복지부 산하 한국보건산업진흥원(KHIDI) 글로벌 의사과학자 양성사업, 한국형 ARPA-H 사업, 농림축산검역검사기술개발사업, 기초과학연구원(IBS), 질병관리청 국립보건연구원 사업, 동그라미재단, 그리고 유한양행의 지원을 받아 이뤄졌다.

2026.05.07

  • AIM2
  • Z-RNA
  • 면역반응
  • 비번역서열
  • 생명과학과
  • 선천면역센서
  • 염증
  • 염증소체
  • 제1형헤르페스
  • 헤르페스

반도체 열·응력 해석 정확도 높이는 AI 기술 개발

손톱만 한 반도체 칩부터 수미터 발전소 배관에 이르기까지, 예측 대상의 크기가 변해도 열이 퍼지는 경로와 힘이 집중되는 부위를 AI가 잘 예측할 수 있도록 돕는 기술이 나왔다. UNIST 반도체소재·부품대학원 정창욱 교수팀은 새로운 입력 데이터를 기존에 학습한 데이터 기준에 맞게 재정렬하는 ‘π-불변 테스트 시점 보정(π-invariant test-time projection)’ 알고리즘을 개발했다고 26일 밝혔다. 이번 연구 결과는 인공지능 분야 3대 국제학회로 꼽히는 국제표현학습학회(ICLR) 2026에 채택됐다. 반도체 공정이나 패키징에서는 열이 퍼지는 경로와 힘이 집중되는 부위를 빠르게 예측하기 위해 인공지능 모델을 활용하고 있지만, 모델이 학습 과정에서 경험하지 못한 아주 크거나 작은 단위의 데이터가 입력되면 예측 정확도가 떨어진다. 연구팀이 개발한 알고리즘은 ‘학습 범위 밖의 입력’을 물리 법칙을 지키면서 학습 범위 안의 ‘익숙한 형태’로 바꿔주는 역할을 한다. 새로운 입력 데이터가 들어오면, 먼저 π 값을 기준으로 기존에 학습한 데이터 중 물리적으로 가장 유사한 데이터를 찾아, 그와 비슷한 조건으로 맞춘 뒤에야 인공지능 모델에 입력해 계산하도록 하는 것이다. π 값은 주어진 물리 방정식에서 길이, 온도, 힘처럼 단위를 가진 물리량을 조합해 만든 무차원 비율로, 이 값이 같으면 크기가 달라도 본질적으로 같은 물리 상태로 볼 수 있다는 ‘버킹엄 π 정리(Buckingham π theorem)’에 기반한 기술이다. 이 알고리즘은 별도의 재학습 없이도 기존 인공지능 모델에 그대로 붙여 사용할 수 있어 경제적이다. 입력 데이터를 로그 공간에서 변환해 물리적 비율(π 값)을 유지하도록 맞추는 방식이기 때문에, 모델 구조나 학습 과정은 건드릴 필요가 없기 때문이다. 또 학습 데이터를 전부 일일이 비교하는 대신 비슷한 데이터끼리 묶어 대표 값만 비교하는 방식을 적용해 계산 부담도 줄였다. 기존의 전수 비교보다 약 1/100 수준의 비용으로도 빠르게 입력을 보정할 수 있다. 이 기법을 2차원 열전도와 선형 탄성 문제에 적용한 결과, 기존 모델이 어려워하던 새로운 조건에서도 안정적인 예측이 가능해졌고, 평균절대오차는 최대 약 91%까지 감소했다. 유체 역학의 난제로 불리는 나비에-스토크스(Navier–Stokes) 방정식에도 적용했을 때도 비슷한 성능 개선 효과가 확인됐다. 나비에-스토크스 방정식은 물이나 공기 같은 유체의 움직임을 설명하는 수식으로, 항공기 설계 등에 필수적이지만 계산이 매우 어려운 것으로 알려져 있다. 개발된 알고리즘은 외력이 없는 이상적인 경우뿐 아니라 외력이 작용해 π 값이 완전히 유지되지 않는 경우에도 정확도 개선 효과를 유지했다. 연구팀은 “반도체 칩의 열 설계, 패키지 신뢰성 평가, 배터리 열관리, 구조물 안전 해석 등 크기와 조건이 계속 달라지는 다양한 공학 시뮬레이션에서 계산 시간과 비용을 줄이는 데 활용될 수 있을 것”이라고 기대했다. 이번 연구는 과학기술정보통신부 한국연구재단의 나노·소재기술개발사업, 정보통신기획평가원(IITP)의 AI대학원지원사업 등의 지원을 받아 수행됐다.

2026.05.07

  • 나비에스토크스방정식
  • 대리모델
  • 버킹엄 π 정리
  • 신소재공학과
  • 열해석
  • 응력해석
  • 인공지능

동전 하나에 천만 화소 담는 퀀텀닷 디스플레이 기술 개발 ..“XR 글라스에도 OK”

퀀텀닷(양자점) 화소를 차세대 XR 글라스에 적용할 수 있는 수준으로 작고 반듯하게 패터닝해 낼 수 있는 기술이 개발됐다. 대낮 야외에서도 선명하게 볼 수 있을 정도로 밝고 또렷한 퀀텀닷 XR 글라스에 대한 기대감이 높아지고 있다. UNIST 화학과 김봉수 교수와 서강대 강문성 교수, 한국전자통신연구원(ETRI) 강찬모 박사 연구팀은 퀀텀닷을 손상시키지 않고 마이크로 패터닝할 수 있는 디스플레이 기술을 개발했다고 23일 밝혔다. 밝기와 색 순도가 뛰어난 퀀텀닷을 스마트 글라스 같은 XR 기기에 쓰려면, 1인치당 3,000개의 화소가 들어갈 수 있을 정도로 화소 크기를 줄이는 마이크로 패터닝이 필요하다. 눈앞에 바로 화면이 펼쳐지는 기기 특성상, 화소가 크면 모기장처럼 나타나 몰입감을 떨어뜨리고 눈 피로를 유발하기 때문이다. 연구팀이 개발한 기술은 퀀텀닷 화소를 머리카락 굵기보다 수십 배 얇은 2마이크로미터(㎛) 크기로 작게 패터닝할 수 있다. 실험에서 1인치당 4,000개의 퀀텀닷 화소를 집적하는 4000 PPI(Pixel Per Inch)의 초고해상도를 달성했으며, 이를 넓이로 환산하면 동전 크기만 한 공간에 1,000만 개 이상의 화소를 집적한 수준이다. 무엇보다 퀀텀닷의 손상이 없고, 화소의 모양과 배열이 설계된 대로 정확히 나온다. 포토레지스트(감광액)막을 ‘틀’로 사용하는 새로운 공법과 자체 개발한 첨가제(가교제)가 비결이다. 포토레지스트는 반도체 공정에서 빛으로 미세한 회로를 그릴 때 쓰이는 소재다. 연구진은 빛을 이용해 포토레지스트막에서 퀀텀닷 잉크가 배열될 공간들을 미리 도려내고, 그 위에 퀀텀닷 잉크를 얇게 도포하는 방식을 썼다. 틀 역할을 했던 포토레지스트막만을 용매로 제거하면 네모 반듯한 퀀텀닷 화소만 남게 된다. 특히 퀀텀닷 잉크 속에는 특수 첨가제(Diazo-4-LiXer)가 들어있어, 포토레지스트를 용매로 벗겨낼 때 퀀텀닷 잉크가 같이 씻겨 나가지 않는다. 용매로 제거하기 전 가열해 첨가제를 활성화시키면, 퀀텀닷 입자들이 서로 단단히 고정돼 모양이 유지되는 원리다. 자외선 활성화 방식과 달리 자외선의 고에너지 때문에 발생하는 손상이 없으며, 열 활성화 온도도 110도로 낮아 열 손상도 차단했다. 또 연구팀은 10x10 배열의 풀컬러 RGB 퀀텀닷 발광다이오드(QD-LED) 어레이를 실제 제작해 안정적인 빛을 내는 것을 확인하며 상용화 가능성도 입증했다. 김봉수 교수는 “이번 성과는 퀀텀닷 고유의 우수한 발광 특성을 유지하면서도 초고해상도 패터닝이 가능한 마이크로 제조 공정”이라며, “최근 애플과 삼성이 눈독을 들이며 격돌하고 있는 차세대 XR 글라스와 마이크로디스플레이 시장에서 기술 경쟁력을 확보하는 데 기여할 것”이라고 밝혔다. 이번 연구는 ‘삼성미래기술육성사업’, 과학기술정보통신부와 한국연구재단이 추진하는 ‘나노 및 소재기술개발사업(국가전략기술소재개발)’ 및 ‘개인기초연구사업(중견연구)’의 지원을 받아 수행됐으며, 연구 결과는 세계적인 학술지인 ‘네이처 커뮤니케이션즈(Nature Communications)’ 온라인판에 지난달 19일 공개됐다.

2026.04.30

  • XR 글라스
  • 가교제
  • 마이크로디스플레이기술
  • 양자점
  • 열활성가교제
  • 퀀텀닷
  • 크로스링커
  • 포토레지스트
  • 화학과

UNIST, 피지컬 AI에 필수 ‘강화학습’ 연구로 세계 3대 AI 학회 논문 3편 동시 채택

UNIST가 피지컬 AI 기술의 핵심인 강화학습 분야에서 국제적 연구 경쟁력을 입증했다. 강화학습은 AI가 환경과 상호작용하며 시행착오를 통해 최적의 행동을 스스로 찾아내는 학습 방식으로, 로봇이나 자율주행차가 불확실하고 예측 불가능한 현실 물리 환경에 직접 부딪히며 상황을 인지하고 돌발 변수에 대처하도록 만들 수 있어 피지컬 AI 시대의 필수 기술로 꼽히고 있다. UNIST는 인공지능대학원 한승열 교수팀의 연구 성과 논문 3편이 오는 23일 브라질 리우데자네이루에서 열리는 표현학습국제학회(ICLR)에 채택되는 쾌거를 올렸다고 21일 밝혔다. ICLR은 신경정보처리시스템학회(NeurIPS), 국제머신러닝학회(ICML)와 함께 세계 3대 AI 학회로 꼽힌다. 이번 성과는 3건은 모두 강화학습 분야에서 나왔다. 각각 ‘자기 개선 스킬 학습법(SISL)’, ‘엄격한 하위 목표 실행 기술(SSE)’, ‘연속적 하위 가치 Q-러닝(S2Q) 알고리즘’이다. ■ 엉터리 데이터로 ‘스킬’ 배운 AI, 스스로 깨우쳐 복잡한 임무 완수한다! 자기 개선 스킬 학습법(SISL)은 오류가 섞인 현장 수집 데이터로 AI 로봇 등을 잘 학습시킬 수 있게 하는 기술이다. 강화학습에는 길고 복잡한 작업을 해결하기 위해 로봇 등의 행동을 스킬이라는 단위로 쪼개어 학습시키는 방식이 있다. 예를 들어 주방용 로봇을 만든다면, 냉장고나 싱크대를 ‘여닫는 행위’, 싱크대나 스토브 같은 목표 장소로 ‘이동하는 행위’를 독립된 스킬로 정의해 학습시키는 것이다. 문제는 이 AI 로봇이 스킬을 익힐 때 교재로 삼는 실제 수집 데이터에 기기 노후화나 센서 오류로 인한 심각한 노이즈가 섞여 있는 경우다. 연구팀이 제시한 SISL은 심각한 노이즈가 포함된 저품질 데이터 환경에서도 자가 개선 메커니즘을 통해 더 유용한 스킬을 능동적으로 발견하고, 스킬 모델 내의 노이즈를 지속적으로 제거하여 고품질의 스킬 라이브러리를 구축할 수 있다. 연구팀은 "기존 시스템과 달리 작업을 수행하는 상위 수준 정책과 스킬 자체를 발전시키는 개선 정책을 분리하는 구조에, 보상 예측 모델을 활용한 '최대 리턴 재라벨링(Maximum return relabeling)' 우선순위 기법을 접목한 기술"이라고 설명했다. 연구는 이상현 연구원이 제1저자로 참여했다. ■ 여러 단계 거쳐야 하는 일도 덜 헤매고 끝까지 해낸다! 강화학습 기반 AI가 여러 단계를 거쳐야 하는 복잡한 작업에서, 중간에 엉뚱한 선택을 반복하지 않고 끝까지 수행하도록 만드는 기술도 개발했다. AI 로봇이 ‘컵을 꺼내 식탁에 놓기’ 같은 일을 하려면 이동, 문 열기, 물건 집기처럼 여러 단계를 순서대로 거쳐야 한다. 기존 방식은 이런 과정을 중간 목표로 나눠 학습하지만, 실제로는 수행하기 어려운 단계까지 섞이면서 로봇이 불필요한 행동을 반복하는 문제가 있었다. 엄격한 하위 목표 실행(SSE, Strict Subgoal Execution)은 이런 문제를 줄이기 위해 설계된 계층적 강화학습 기법이다. 도달할 수 없는 목표와 실행 가능한 목표를 엄격하게 분리하고, 완전히 실패한 경우와 일부만 성공한 경우를 구분해 에이전트가 실제로 도달할 수 있는 범위를 학습하도록 함으로써 상위 수준의 의사결정 과정을 획기적으로 간소화했다. 또 어디까지는 수행됐고, 어디부터 막혔는지를 기록해 반복적으로 실패하는 경로는 피하도록 했으며, 탐색이 부족한 영역을 찾아가는 별도의 탐색 전략과 실패 기록을 반영한 경로 정제 기법을 함께 적용해 다단계 과제도 효율적으로 목표를 달성하도록 했다. 다양한 벤치마크 실험에서 이 알고리즘은 복잡하고 장기적인 계획이 필요한 기존 강화학습 방법들을 압도하는 높은 효율성과 임무 성공률을 달성했다. 황재박 연구원이 제1저자로 참여했다. 연구팀은 “성공, 실패, 부분 성공을 나눠 저장해 학습 신호를 정리하는 데이터 재구성 기법인 프론티어 익스피리언스 리플레이(Frontier Experience Replay)를 개발해, 에이전트가 실제로 도달할 수 있는 범위를 학습하도록 한 것이 핵심”이라고 설명했다. ■“협력 AI도 상황 따라 바뀐다”… ‘유연한 뇌’ S2Q 알고리즘 개발 여러 AI가 협력해 움직이는 환경에서는 상황이 바뀌면서 더 나은 선택이 뒤늦게 나타나는 경우가 많다. 예를 들어 게임이나 로봇 협력 작업에서는 처음엔 좋은 선택이었던 행동이 시간이 지나면서 더 이상 최선이 아니게 바뀌기도 한다. 기존 강화학습은 한 시점에서 가장 좋아 보이는 행동 하나에 집중해 학습하기 때문에, 이런 변화가 생기면 새로운 최적 전략을 따라가지 못하고 기존 선택에 머무르는 경우가 많았다. 연구팀의 ‘연속적 하위 가치 Q-러닝(S2Q)’은 여러 개의 대안 행동을 함께 학습하도록 설계된 방법이다. 가장 좋은 선택뿐 아니라 그 다음으로 유망한 선택들까지 유지하면서, 상황이 바뀌면 이를 빠르게 새로운 최적 전략으로 전환할 수 있도록 했다. 제1저자인 조용현 연구원은 “기존의 다중 에이전트 인공지능이 오직 하나의 고정된 최적 행동에만 의존해 학습 중 상황 변화에 대처하지 못하는 ‘경직된 시스템’이었다면, 이번에 개발된 S2Q 기술은 훌륭한 대안이 될 수 있는 여러 차선책들을 미리 기억하고 유지하여 급변하는 상황에 즉각적으로 대처하는 ‘유연한 뇌’ 역할을 하는 기술”이라고 설명했다. 스타크래프트 멀티 에이전트 챌린지(SMAC) 및 구글 리서치 풋볼(GRF) 등 고난이도 벤치마크 테스트 결과, 기존 알고리즘들이 흔히 직면하던 조기 수렴 한계를 극복하고 적응력과 전반적인 성능을 대폭 향상시켰다. 한승열 교수는 “이번 연구는 제한된 데이터와 불확실한 환경에서도 강화학습을 안정적으로 적용할 수 있는 가능성을 보여준 것”이라며 “자율주행, 로봇, 스마트 제조 등 다양한 분야로의 확장이 기대된다”고 말했다. 연구수행은 과학기술정보통신부 정보통신기획평가원의 ‘자율드론상용화를 위한 과제 지향 강화학습 핵심기술 개발’, ‘AI 스타 펠로우십 프로그램’, ‘인공지능대학원 지원 사업’과 한국연구재단의 ‘LLM 기반 다중 에이전트 강화학습을 통한 대규모 자율군집제어 End-to-End 기술 개발 사업’의 지원을 받아 이뤄졌다. 한편, 올해 학회는 오는 4월 23일부터 27일까지 브라질 리우데자네이루에서 열린다.

2026.04.28

  • 강화학습
  • 로봇
  • 멀티에이전트
  • 인공지능대학원
  • 자율드론
  • 자율주행
  • 피지컬AI

뇌 깊숙한 곳에서 찾은 도파민 신호 조절의 ‘공간 규칙’

같은 뇌 신경회로 안에서도 세부 구역에 따라 도파민의 신호 조절 방식이 달라지는 ‘공간 규칙’이 발견됐다. UNIST 생명과학과 김재익 교수팀은 기저핵 간접경로에서 도파민이 억제성 신호를 조절하는 방식이 기저핵의 내부 위치에 따라 다르다는 점을 규명했다고 20일 밝혔다. 뇌 깊숙이 위치한 기저핵은 자발적인 운동을 조절하는 신경회로로, 그중 ‘간접경로’ 회로는 불필요한 움직임을 억제하는 역할을 한다. 이 경로에서 기저핵의 선조체와 외측 창백핵(GPe)을 잇는 시냅스 연결은 가바(GABA)라는 억제성 신경전달물질을 통해 작동하며, 도파민은 이 신호의 강도를 조절하는 물질로 알려져 있다. 연구팀이 밝혀낸 바에 따르면, 도파민이 억제 신호를 낮추는 역할을 똑같이 하더라도 공간 구획에 따라 조절 방식이 달랐다. 창백핵을 4등분했을 때 배외측과 복내측 영역에서는 도파민이 D2 수용체를 통해 가바 방출 자체를 줄여 억제 신호를 약하게 만들었고, 배내측과 복외측 영역에서는 D4 수용체가 작용해 같은 신호에 대한 반응을 낮추는 방식으로 억제 신호를 줄였다. 즉, 도파민이 한쪽에서는 억제 신호 자체를 줄이고, 다른 쪽에서는 같은 신호에도 덜 민감하게 반응하도록 조절하는 방식이다. 또 파킨슨병처럼 도파인 분비를 줄인 실험 쥐의 뇌는 기존에 유지되던 이 공간별 조절 패턴이 뒤집히는 변화가 나타났다. 원래는 영향을 받지 않던 영역에서 신호 조절이 새롭게 나타나고, 반대로 기존에 강하게 작용하던 영역에서는 효과가 약해졌다. 제1저자인 이영은 연구원은 “도파민 감소가 단순히 전체 신호를 약하게 만드는 것이 아니라, 회로의 작동 방식 자체를 재편할 수 있음을 보여주는 실험 결과”라고 설명했다. 김재익 교수는 “뇌 기저핵을 통과하는 다양한 감각, 운동 정보가 창백핵의 위치에 따라 도파민에 의해 각기 다르게 변조될 수 있음을 밝혀냈다”며 “특정 뇌 영역과 수용체를 표적으로 하는 파킨슨 병 치료제와 같은 정밀 퇴행성 뇌질환 치료 기술 개발을 위한 신경과학적 기반을 마련했다”고 말했다. 이번 연구결과는 다학제적 연구결과를 소개하는 우수 학술지인 네이처 커뮤니케이션즈(Nature communications)’에 4월 3일 자로 공개됐다. 연구수행은 과학기술정보통신부 한국연구재단 중견연구(핵심연구), 바이오의료기술개발사업, 그리고 뇌기능규명조절기술개발사업의 지원을 받아 이뤄졌다.

2026.04.26

  • 4분할
  • 가바
  • 간접회로경로
  • 기저핵
  • 도파민
  • 생명과학과
  • 수의운동
  • 시냅스
  • 억제신호
  • 운동억제
  • 창백핵

더보기

Research Impact

star

Ultrafast 3D Microfabrication Technology Produces Complex Structures in Just 60 Seconds

Abstract Despite the advantages of additive manufacturing (AM) in creating customized 3D shapes, conventional layer-by-layer approaches are limited by low production rates, restricting their broader applications. Volumetric additive manufacturing (VAM) has emerged as a promising technique, enabling the simultaneous photopolymerization of entire volumes, which significantly reduces fabrication time. However, current computed axial lithography requires manual operations per print cycle, such as loading resin into a vial, physically placing and aligning the vial (with or without an index-matching medium), and removing the printed object, limiting continuous, high-throughput production of multiple parts. Here, we propose a dispensing volumetric additive manufacturing (DVAM) method that prints and dispenses each part within a droplet in less than a minute. The printing process occurs within a single droplet dispensed from a glass pipette, enabling simultaneous printed object removal and resin replenishment in a second. Light pattern distortion caused by the absence of the index-matching fluid was corrected through real-time droplet profile estimation and inverse ray-tracing within the optical system. We demonstrate rapid serial VAM of 10 different objects within 10 min. This approach establishes a practical pathway toward scalable, high-throughput volumetric manufacturing, enabling rapid production of complex 3D structures without the operational bottlenecks of conventional VAM workflows. A research team affiliated with UNIST has achieved a major breakthrough in 3D microfabrication, enabling the rapid production of intricate 3D structures within a single minute. The new technology promises to significantly accelerate manufacturing processes in fields, ranging from biomedical devices to microelectronics. Led by Professor Im Doo Jung from the Department of Mechanical Engineering at UNIST, the research team developed a cutting-edge dispensing volumetric additive manufacturing (DVAM) system.The new approach moves beyond traditional layer-by-layer methods, allowing for the swift, continuous fabrication of diverse three-dimensional shapes within a matter of minutes by employing a volumetric printing process. DVAM utilizes a fine resin droplet dispensed from a glass pipette as the entire build volume. Light is projected onto the droplet to cure the desired shape in real-time. Once a structure is solidified, compressed air expels the finished object, and a new droplet is immediately dispensed for the next cycle. This seamless process enables high-speed, continuous production without the need for post-processing or layer-by-layer assembly. Unlike conventional volumetric printing methods—such as Computed Axial Lithography (CAL)—which require filling a resin container, matching refractive indices with immersion fluids, and manually removing finished parts, the UNIST team’s approach eliminates these constraints. By performing printing within a single resin droplet that acts as the entire volume, they achieve rapid, uninterrupted manufacturing. One of the main challenges was optical distortion caused by the droplet’s curved surface. To overcome this, the researchers integrated artificial intelligence with inverse ray-tracing optical calculations. A deep learning-based AI accurately detects the droplet’s profile in real-time, enabling the system to mathematically correct for distortions and project precise light patterns for uniform curing. This advanced system successfully produced intricate structures, such as the Eiffel Tower and The Thinker, within just 10 minutes—demonstrating the ability to fabricate ten different objects with an average time of around 60 seconds each. Hongryung Jeon, the first author of the study, explained, “Unlike traditional 3D printing that builds objects layer by layer, our method cures the entire volume at once and continuously dispenses resin without additional post-processing, increasing speed by over 100 times. This opens up exciting possibilities for large-scale, rapid production of micro-scale components.” Professor Jung, the corresponding author, emphasized, “Speed has long been a limiting factor in 3D printing, especially for customized manufacturing. By moving away from conventional photopolymerization and employing artificial intelligence to compensate for optical distortions, we have significantly advanced the potential of ultrafast volumetric fabrication. Now, complex shapes can be produced in seconds—eliminating long wait times.” The findings of this research have been published online in Advanced Functional Materials (Impact Factor: 19.0, top 5% in JCR) on March 21, 2026. The project was supported by the National Research Foundation of Korea (NRF), the Ministry of Science and ICT (MSIT), the Institute for Information & communications Technology Planning & Evaluation (IITP), and the Ministry of Trade, Industry & Energy (MOTIE). Journal Reference Hongryung Jeon, Yunsoo Lee, Seobin Park, et al., "Dispensing Volumetric Additive Manufacturing," Adv. Funct. Mater., (2026).

2026.05.12

  • 3D Printing
  • Advanced Functional Materials
  • CAL
  • Computed Axial Lithography
  • Department of Mechanical Engineering
  • DVAM
  • Im Doo Jung
  • Layer-by-Layer
  • Lithography
  • ME

New AI Algorithm to Enhance Accuracy of Thermal and Stress Predictions in Semiconductors

Abstract PDE surrogate models such as FNO and PINN struggle to predict solutions across inputs with diverse physical units and scales, limiting their out-of-distribution (OOD) generalization. We propose a π-invariant test-time projection that aligns test inputs with the training distribution by solving a log-space least squares problem that preserves Buckingham π-invariants. For PDEs with multidimensional spatial fields, we use geometric representative π-values to compute distances and project inputs, overcoming degeneracy and singular points that limit prior π methods. To accelerate projection, we cluster the training set into K clusters, reducing the complexity from O(MN) to O(KN) for the M training and N test samples. Across wide input scale ranges, tests on 2D thermal conduction and linear elasticity achieve MAE reduction of up to ≈91% with minimal overhead. This training-free, model-agnostic method is expected to apply to more diverse PDE-based simulations. A research team affiliated with UNIST has introduced a novel AI-based algorithm that enhances the accuracy of thermal and mechanical predictions across various scales, from microchips to large pipelines. Led by Professor Changwook Jeong from the Graduate School of Semiconductor Materials and Devices Engineering, their π-invariant test-time projection method realigns input data to conform with physical laws, addressing a crucial challenge in AI modeling—accurate predictions when faced with unfamiliar or out-of-distribution data. The algorithm identifies the most physically similar data within existing training sets based on a dimensionless ratio derived from Buckingham's π theorem. It then transforms new inputs into familiar, physically consistent forms without retraining the model, operating in log space to preserve physical ratios. This approach is computationally efficient, reducing processing costs by approximately 99% compared to traditional methods. Applied to 2D thermal conduction and linear elasticity problems, the technique achieved up to a 91% reduction in prediction error, even under conditions outside the original training range. It also demonstrated promising results in fluid dynamics, improving the accuracy of Navier–Stokes equation predictions in complex scenarios. This advancement is expected to accelerate and economize simulations in semiconductor design, packaging reliability, battery management, and structural safety analysis—fields where varying sizes and conditions demand both precision and efficiency. The study has been supported by the National Research Foundation of Korea (NRF) and the Institute of Information & Communications Technology Planning & Evaluation (IITP). Journal Reference Seokki Lee, Min-Chul Park, Giyong Hong, and Changwook Jeong, "Buckingham π-Invariant Test‑Time Projection for Robust PDE Surrogate Modeling," ICLR 2026 .

2026.05.11

  • AI Algorithm
  • Buckingham-pi
  • Changwook Jeong
  • Department of Materials Science and Engineering
  • ICLR
  • MSE
  • Navier–Stokes
  • PDE
  • SE
  • Semiconductor
  • Stress Predictions
  • Thermal Prediction

New Study Unveils Viral DNA ‘Barcode’ that Activates Innate Immunity, Opening New Therapeutic Avenues

Abstract Herpes simplex virus type 1 (HSV-1) infection remains a major global health challenge, yet the mechanisms underlying strain-specific innate immune responses are poorly understood. Here, we show that distinct HSV-1 strains differentially activate the absent in melanoma 2 (AIM2) inflammasome. The HF strain robustly induces AIM2-dependent inflammasome activation, whereas the F and KOS strains elicit minimal responses despite comparable infection efficiency. We demonstrate that this difference is driven by viral genomic features rather than replication capacity. Genomic analyses identify a poly(T) DNA sequence within the UL25-UL26 intergenic region that is enriched in the HF strain. Deletion of a 14-mer poly(T) sequence markedly impairs inflammasome activation, cytokine release, and host protection in vivo, whereas introduction of a poly(T) tract into the F strain is sufficient to confer AIM2 activation and enhanced host defense. Furthermore, poly(T)-mediated AIM2 activation is length-dependent, conserved in human macrophages, and requires a cGAS-STING-IRF1 licensing axis. Together, these findings identify viral poly(T) DNA as a key determinant of strain-specific AIM2 inflammasome activation and reveal how viral genomic variation shapes innate immune recognition. A research team, led by Professor SangJoon Lee from the Department of Biological Sciences at UNIST has identified a specific viral DNA sequence that triggers the body’s innate immune system, offering new insights into viral detection mechanisms and potential avenues for immunomodulatory therapies. In collaboration with Professor Joo Sang Lee from Sungkyunkwan University, Professor Eui Tae Kim from Jeju National University, and Director Young Ki Choi from the Korea Virus Research Institute at the Institute for Basic Science (IBS), the team demonstrated that a repetitive poly(T) sequence within the genome of herpes simplex virus type 1 (HSV-1) functions as a molecular barcode recognized by the innate immune sensor AIM2. HSV-1 infects about 67% of the global population and remains dormant in nerve cells, evading immune detection. Upon reactivation, it infects epithelial cells, provoking inflammation as part of the host’s defense. The study revealed that AIM2, a pivotal immune sensor in macrophages, detects the virus by recognizing poly(T) tracts—regions of repeated thymine (T) nucleotides—in its DNA. Importantly, immune activation was shown to depend on both the presence and length of this poly(T) sequence: longer repeats elicited stronger inflammatory responses and induced apoptosis in infected cells. Strains lacking the sequence or with fewer than 20 thymine bases elicited minimal immune activity. Introducing the poly(T) sequence into less responsive strains restored immune detection, with increased length correlating to heightened responses. These findings were confirmed in animal models, where viruses containing the poly(T) motif triggered inflammation and suppressed viral replication, while those without it led to unchecked proliferation and more severe disease outcomes. Further genomic analysis revealed that similar poly(T) repeats are conserved across various pathogenic viruses—including orthopoxviruses, adenoviruses, and coronaviruses—indicating a shared mechanism of immune recognition. “This study demonstrates that innate immune sensors recognize viral genomes with greater specificity than previously thought,” said Professor Lee. “Targeting these sensing pathways, rather than the viruses themselves, may offer innovative therapeutic options. Our research provides a foundation for developing immunomodulatory treatments for infectious diseases.” He added, “Given the conservation of this sequence across multiple viruses associated with severe illnesses, understanding its role could help link viral genomic features to disease severity and inform the design of targeted therapies.” Published in Nature Communications on April 13, the study was supported by multiple funding agencies, including the National Research Foundation of Korea (NRF), the Korea Health Industry Development Institute (KHIDI), the Ministry of Health and Welfare (MOHW), the Institute for Basic Science (IBS), the Circle Foundation, and Yuhan Corporation. Journal Reference SuHyeon Oh, Jueun Oh, Kyeongchan Im, et al., "Herpes simplex virus 1 harboring poly(T) DNA sequences as a key ligand for AIM2 inflammasome activation and host defense," Nat. Commun., (2026).

2026.05.04

  • Bio
  • Department of Biological Sciences
  • DNA
  • Herpes
  • Nature Communications
  • SangJoon Lee

Re‑Engineering the Future: For A More Resilience World

《 Editor's Note: Across fields that range from energy engineering to quantum physics, UNIST researchers share a common aim: redesigning the systems that sustain life and technology. Their latest work—converting solar‑panel waste into clean hydrogen, restoring vision through nanomedicine, and decoding the feedback loops driving global wildfires—positions science not merely as discovery, but as a blueprint for resilience.》 Sensing the Future From visions that steer robots to displays sharper than reality, UNIST researchers are redefining how machines interpret the human world. A smart contact lens equipped with AI‑driven sensors enables vision‑based robotic control, while a new quantum‑dot technique achieves over 4,000 pixels per inch—paving the way for ultra‑compact extended‑reality glasses. On a different frontier, three papers accepted to ICLR 2026 show the university's rising influence in reinforcement learning, advancing physical AI systems that learn directly from their environments. Together, these studies represent technology that doesn't just emulate perception—it extends it. • Smart Contact Lens for Vision-Based Robotic Control (Adv. Funct. Mater. l Mar., 2026) • Breakthrough QD Display with 4,000 PPI Resolution (Nat. Commun. l Mar., 2026) • Three Research Papers Accepted to ICLR 2026 Circulating Energy What if waste could power the next energy revolution? Two separate breakthroughs at UNIST bring that vision closer. One process converts end‑of‑life solar panels into high‑purity hydrogen and silica using mechanochemical reactions; Another turns industrial glycerol into hydrogen and value‑added chemicals through a scalable electrochemical system. Both replace extraction with regeneration, showing how circular design can meet industrial scale without environmental cost. This emerging “loop thinking” is central to UNIST's broader push toward a sustainable hydrogen economy. • Solar Panel Waste into H2 and High-Value Silica (Joule l Mar., 2026) • Turning Waste Glycerol into H2 and High-Value Chemicals (Joule l Mar., 2026) Healing Systems At the intersection of biology and environment, UNIST scientists are uncovering how systems heal themselves. A nanomedicine platform that selectively removes aging retinal cells restores vision in degenerative models, while another study reveals how alcohol and immune signaling interact to amplify liver damage—insights that could guide future therapies. On a planetary scale, researchers have identified a climate “regime shift” behind Australia's increasing wildfire intensity and developed AI frameworks for real‑time multilevel air‑pollution prediction. From cells to climate, the common thread is understanding how complex networks can recover balance. • Targeted Nanoparticles Aging Retinal Cells (Nat. Commun. l Mar., 2026) • Alcohol Amplifies Liver Damage During Illness (Sci. Adv. l Apr., 2026) • Climate Prediction (Nat. Commun. l Mar., 2026 ) • Wildfire Prediction (Agric. For. Meteorol. l Apr., 2026 ) • Deep Learning for Multiple Air Pollutant Analysis (Environ. Sci. Technol. l Mar., 2026) Across its laboratories, UNIST demonstrates that resilience is not a separate discipline—it is a design principle. By approaching technology, energy, and biology as interconnected systems, these efforts move beyond repair. They point instead toward a more fundamental question: How Can the World Be Designed to Endure—and Renew?

2026.05.01

  • Aging Retinal Cells
  • Alcohol
  • Climate Regime Shift
  • Hydrogen Economy
  • Liver Damage
  • Nanomedicine
  • Wildfires

Breakthrough QD Display Technology Achieves 4,000 PPI Resolution — Ideal for XR Glasses

Abstract Colloidal quantum dots (QDs) are leading candidates for next-generation optoelectronics owing to their tuneable bandgaps, narrow emission linewidths, and high luminescence quantum yields. For virtual-, augmented-, and mixed-reality display applications of these materials, patterning full-color QDs at μm-length scales is essential. However, existing photolithographic approaches often degrade QD luminance characteristics by exposing them to harsh processing conditions, or they compromise the structural fidelity of the resulting patterns. Here we report a photoresist-guided indirect (PIN) photopatterning strategy that includes (i) lithographic formation of sacrificial PR patterns, (ii) deposition of a crosslinked QD film on top, and (iii) PR stripping that removes the sacrificial PR, leaving behind crosslinked QD patterns on the substrate. QD crosslinking is mediated by a diazo-based ligand thermocrosslinker, Diazo-4-LiXer. Leveraging low-temperature (110–120 °C)-activated carbene chemistry, Diazo-4-LiXer bridges neighbouring QDs while maintaining their intrinsic photoluminescence and electroluminescence through repeated processing. Moreover, Diazo-4-LiXer enables thermocrosslinking without affecting the underlying photoresist pre-patterns, which serve as structural templates determining the thickness and fidelity of the QD patterns. Using PIN photopatterning, we realize high-fidelity RGB patterns exceeding 4,000 pixels per inch resolution and demonstrate integration-level scalability by fabricating a 10 × 10 passive-matrix full-colour RGB QD–LED array. Researchers, affiliated with UNIST have announced a significant advancement in quantum dot (QD) display technology, enabling ultra-fine, high-resolution patterning of QDs suitable for next-generation XR glasses. This innovation promises brighter, more vivid images even in outdoor environments. Professor BongSoo Kim from the Department of Chemistry at UNIST, in collaboration with Professor Moon Sung Kang of Sogang University and Dr. Chan-mo Kang at Electronics and Telecommunications Research Institute (ETRI), have developed a novel photopatterning technique that maintains the integrity of quantum dots while achieving micron-scale precision. To meet the demanding resolution required for XR displays—exceeding 3,000 pixels per inch (PPI)—the team’s method patterns quantum dots into 2-micrometer (μm) pixels. This enables over 4,000 PPI, meaning more than 10 million pixels can be packed into a space about the size of a coin, ensuring sharp, immersive visuals. The process employs a custom-developed additive, Diazo-4-LiXer, which facilitates thermocrosslinking at low temperatures (110–120°C) via carbene chemistry, preserving the quantum dots’ luminescent properties. It involves creating a sacrificial photoresist (PR) template, depositing a crosslinked quantum dot film, then removing the PR to leave behind precisely patterned quantum dots—without damage or shape distortion. This technique not only achieves high fidelity and density but also enables the fabrication of full-color RGB quantum dot LED arrays, demonstrating its potential for commercial application. Professor Kim commented, “Our method allows for ultra-high resolution patterning of quantum dots while maintaining their exceptional optical properties. It opens new avenues for advanced XR glasses and microdisplays, where brightness, color purity, and resolution are crucial.” The findings of this research have been published in Nature Communications on March 19, 2026. The study has been supported by the Samsung Research Funding & Incubation Center of Samsung Electronics, the National Research Foundation of Korea (NRF), and the Ministry of Science and ICT (MSIT). Journal Reference Hyeokjun Kim, Hyobin Ham, Chang Hyeok Lim, et al., "Photoresist-guided indirect photopatterning of quantum dots via carbene-mediated ligand thermocrosslinking," Nat. Commun., (2026).

2026.04.27

  • 4000PPI
  • BongSoo Kim
  • Chemistry
  • Crosslinker
  • Department of Chemistry
  • Microdisplay
  • Nature Communications
  • Pattern Fidelity
  • Photopatterning
  • Photoreist
  • QD-LED
  • Quantum Dot
  • Thermocrosslinking
  • VR
  • XR

UNIST Demonstrates Global Competitiveness in Reinforcement Learning with Three Papers Accepted to ICLR 2026

UNIST has demonstrated strong international competitiveness in reinforcement learning, a core technology for physical AI, with three papers by Professor Seungyul Han’s research group from the Graduate School of Artificial Intelligence accepted to the International Conference on Learning Representations (ICLR 2026), held in Rio de Janeiro, Brazil, from April 23 to 27, 2026. ICLR, alongside NeurIPS and ICML, is widely regarded as one of the world’s leading artificial intelligence conferences. This year, approximately 5,300 papers—about 27% of more than 19,000 submissions—were accepted, making the selection of three papers from a single research group a notable achievement. The accepted studies address key challenges in reinforcement learning, where AI systems learn optimal actions through interaction with their environment—an approach essential for applications, such as robotics and autonomous systems operating in complex, real-world conditions. The first study proposes Self-Improving Skill Learning (SISL), a method designed to enable robust learning from noisy offline data. By decomposing long-horizon tasks into reusable skills and refining them through prioritized updates, SISL mitigates the impact of imperfect data and supports stable adaptation across complex tasks. The second study introduces Strict Subgoal Execution (SSE), which improves long-horizon planning by distinguishing feasible subgoals from unreachable ones. By leveraging past failures and partial successes, the method enhances planning efficiency and increases overall task reliability in goal-conditioned environments. The third study presents Successive Sub-value Q-learning (S2Q), a framework for multi-agent reinforcement learning (MARL) that retains multiple high-value action candidates. This approach enables agents to adapt more effectively in dynamic environments where optimal strategies shift over time, improving both coordination and overall performance. The research was led by Sanghyun Lee, Jaebak Hwang, and Yonghyeon Cho as first authors, respectively, and supported by programs funded by the Ministry of Science and ICT (MSIT) and the National Research Foundation of Korea (NRF). Professor Han said, “Our research demonstrates that reinforcement learning can be applied more reliably in environments with limited data and uncertainty, with strong potential for applications in autonomous driving, robotics, and smart manufacturing.” Journal Reference [1] Sanghyeon Lee, Sangjun Bae, Yisak Park, Seungyul Han, "Self-Improving Skill Learning for Robust Skill-based Meta-Reinforcement Learning," ICLR 2026. [2] Jaebak Hwang, Sanghyeon Lee, Jeongmo Kim, Seungyul Han, "Strict Subgoal Execution: Reliable Long-Horizon Planning in Hierarchical Reinforcement Learning," ICLR 2026. [3] Yonghyeon Jo, Sunwoo Lee, Seungyul Han, "Retaining Suboptimal Actions to Follow Shifting Optima in Multi-Agent Reinforcement Learning," ICLR 2026.

2026.04.27

  • and Yonghyeon Cho
  • Jaebak Hwang
  • S2Q
  • Sanghyun Lee
  • Self-Improving Skill Learning
  • Seungyul Han
  • SISL
  • SSE
  • Strict Subgoal Execution
  • Sub-value Q-learning

더보기

UNIST Insight

star

UNISTAR Voices 
Shaping Futures, 
Inspiring the 
World

더보기

Life at UNIST

star