


“동일한 연산을 수행하는 데 필요한 컴퓨터의 전력 소모는 지속적으로 작아진 반도체 덕분에 꾸준히 낮아졌지만 이제 물리적 한계로 반도체를 작게 만드는 게 어려워졌습니다. 이러한 한계는 인공지능(AI) 경량화 모델을 통해 극복될 수 있습니다.”
과학기술정보통신부와 한국연구재단은 30일 ‘이달의 과학기술인상’ 5월 수상자로 김재준 서울대 전기·정보공학부 교수를 선정했다.
과기정통부와 연구재단은 “김 교수가 AI 모델을 경량화하고, 경량화된 모델을 효율적으로 연산하는 반도체 가속기를 개발해 다양한 환경에서 저전력으로 활용할 수 있는 AI 기반 기술을 제시한 공로가 크다”며 선정 이유를 밝혔다. 반도체 가속기는 범용 계산이 아닌 특정 응용의 연산에 최적화된 반도체 칩이다.
김 교수는 오랜 시간 동일한 성능을 유지하면서도 전력 소비를 최소화하는 회로 설계 연구에 매진해왔다. 그는 “저전력 기술이 없다면 에너지 효율이 떨어져 휴대폰을 한 시간마다 충전해야 하는 불편함이 생긴다”며 “특히 AI가 복잡한 계산을 더 효율적으로 수행하려면 알고리즘과 하드웨어를 함께 설계하는 것이 중요하다”고 설명했다. 이어 “AI 컴퓨팅도 결국에는 기존 일반 컴퓨팅의 역사와 유사하게 더 작게, 더 저전력으로 발전할 것이라는 믿음을 갖고 있다”고 덧붙였다.
실제로 최근 챗GPT와 같은 대규모 AI 모델이 산업과 일상생활 전반에 빠르게 확산되면서 효율성을 높이기 위해 AI 모델의 크기를 줄이는 ‘경량화’ 기술과 경량화된 모델을 효과적으로 연산하는 ‘반도체 가속기’ 기술이 주목받고 있다. ‘경량화’란 AI 모델의 정확도를 최대한 유지하면서 크기나 연산량을 줄이는 기술을 말한다. 이 기술은 AI의 지속적인 발전과 활용 확대를 위해 매우 중요한 요소로 부상하고 있다. 하지만 지금까지는 대부분 소프트웨어 중심으로 연구가 이뤄졌고 하드웨어 측면은 충분히 고려되지 못했다. 김 교수는 “줄어든 모델을 실제 하드웨어에서 실행할 경우 성능이 오히려 떨어지는 경우가 많고, 반대로 하드웨어를 설계하는 쪽에서는 AI 모델에 대한 충분한 이해 없이 칩에 맞게 모델을 임의로 바꾸는 경우도 있다”고 지적했다.

이에 김 교수는 하드웨어 특성을 고려한 새로운 경량화 방법을 고안했고, 줄어든 모델에 맞춰 효율적으로 작동할 수 있는 전용 반도체 가속기를 함께 개발했다. 그는 가변적인 ‘비트 정밀도’를 갖는 AI 경량화 모델을 하나의 가속기 회로로 지원할 수 있는 새로운 설계 방법을 제시했다. ‘가변 정밀도’는 연산 정확도나 자원 상황에 따라 연산에 사용하는 비트 수를 조절하는 방식이다. 김 교수는 정밀도마다 따로 회로를 만드는 기존 방식 대신 연산 순서를 바꾸는 방법을 적용함으로써 회로 구조를 단순화하고 가변 정밀도를 효율적으로 처리할 수 있게 했다. 그는 “AI 모델 경량화 및 가속기 설계 연구는 과거 컴퓨터가 점점 작아지며 휴대폰으로 발전한 역사와 유사한 흐름을 보일 것”이라며 이를 극복하기 위해 현재 수준보다 전력 소모가 극적으로 작은 컴퓨터를 구현하는 새로운 방향을 계속해서 고민하고 싶다”고 말했다.
한편 김 교수는 앞으로 ‘가장 단순한 구조를 찾는 연구’를 통해 산업 현장에서 실제로 활용할 수 있는 기술을 만들고 싶다는 포부를 나타냈다. 그는 “복잡한 구조로 뛰어난 성능을 내더라도 현실에서 사용하기 어렵다면 의미가 없다”며 “조금 성능이 부족하더라도 실제 적용 가능한 단순한 구조를 설계하는 것이 더 중요하다”고 강조했다.
이번 ‘가변 정밀도 기반 경량화 AI 반도체’ 연구 성과는 2022년 6월, 세계적 권위의 반도체 회로 설계 학술지 JSSC에 실렸으며 저전력 AI 반도체 관련 후속 연구는 2023년 5월 국제 학회 ICLR에서 발표됐다.