[김주한 교수의 정보의료·디지털 사피엔스]'독 (甕) 안에서 별(星)을 헤다'

2025-06-19

마주한 두 거울의 한가운데에 촛불을 켜 놓으면 반사된 수많은 촛불 상이 비춰진다. 거울 속 촛불은 모두 몇 개일까? '논리 세계'라면 촛불의 반사는 서로 마주한 거울 사이에서 무한 반복될 테니 무한히 많을 듯하다. '물리 세계'에서는 빛의 에너지도 조금씩 감소하고 간섭과 회절의 영향도 있어 유한한 수의 촛불만 관측 가능할 듯하다. 과연 진실은 어디쯤 있을까?

어려운 질문에 척척 잘도 답해대는 챗GPT가 유독 숫자에는 약하다. 왜일까? 챗GPT가 사는 세계는 문자로 이뤄진 '언어의 세계'이기 때문이고 '수의 세계'는 언어의 세계와 전혀 다르기 때문이다. 자연수만도 무한하다. 모든 수를 다 저장할 수 없다. 0~9만으로 이루어진 수는 소수점 아래로도 무한하고 특정한 패턴이 없다. '언어의 세계'에서는 같은 단어도 맥락에 따라 달리 해석되지만 '수의 세계'는 사칙연산 법칙에 따라 정확히 확정된다. 확정 불가능한 '언어 표현'은 근원적 모호성을 갖는다. 빈칸 채우기가 특기인 챗GPT는 '수'를 '단어'처럼 다룬다. 토큰화하고 분할 처리한다. '37' 같은 숫자도 '3' + '7'의 토큰으로 분해하고 유사성에 의존해 문맥을 잃기 쉽다. 수는 무한해서 다 저장할 수 없고 특정한 패턴이 없는 수의 세계를 챗GPT는 온전히 다룰 수 없다.

챗GPT가 요즘에는 웬만한 수식 계산을 꽤 잘한다. 직접 처리할 수 없는 계산과 마주치면 잠시 멈춘 후 Code Interpreter나 Wolfram Alpha 같은 계산 기계를 내장한 '수의 세계'에 연산을 의뢰해 그 결과물을 다시 언어적으로 처리해 계산정확도를 좀 높인 덕분이다. 예를 들면, 전화번호는 서로 더하거나 뺄 수 있는 수가 아니며, 두 전화번호를 더해서 산출된 새 번호는 실제로는 전혀 존재하지 않는 번호일 수 있다. '수의 세계'는 조밀하여 숫자로 표현된 모든 수가 다 존재함과 상반된다. '전화번호'는 사실 '단어'나 '문자열'에 더 가깝지만 챗GPT가 수인지 단어인지를 구분하기엔 쉽지 않은 맥락 판단 문제다.

큰 통계표에 시대별, 성별, 연령별, 지역별 '흡연율'이 나열된 상황에서 챗GPT는 질의된 '흡연율'을 정확하게 추출하지 못한다. '흡연율'은 숫자로 표현돼 있지만, '비슷한 흡연율'을 '같은 값'으로 처리하는 에러를 낸다. 통계표에 숫자로 표현된 '흡연율'은 사실 카테고리별 속성값이므로 '수'보다 '단어'에 가깝다. 데이터베이스에 조건별 '흡연율'을 속성값으로 저장하고 질의응답 처리해야 확정된다. '비슷하면 같은 것'으로 취급하는 챗GPT 세상에서는 불가능하다. RAG 방식의 토큰화로 데이터베이스 연동을 모사하는 것은 도움이 되지만, 통계표가 웬만큼 커지면 RAG 토큰화로 처리 불가능하다. 결국 챗GPT는 또 다른 세계인 데이터 테이블의 '집합연산 세계'로 넘어가야 한다.

사칙연산이 지배하는 '수의 세계'와 집합연산 '데이터 세계'와 '언어의 세계'는 확실히 다른 세계다. 그뿐 아니다. '논리' '물리' '기하' '실시간적 상호작용' 및 '감각'과 '상징' 등 제각각의 법칙을 따르는 수많은 세계를 쉬지 않고 넘나들 운명이다. 이상적으로는 하나의 입력을 하위 세계의 문제들로 분할하고 각각의 연산 법칙에 따라 처리하기 위한 (1)작업 분할 (2)미리 정의한 워크플로 설계 (3)중간 결과물들의 통합이 필수다. 그렇다면 고전적 '전문가 시스템'과 뭐가 다른가? 물론 자연어 처리 능력이 좀 더 정교하고 유연해졌다. 모듈 간 작업 흐름을 조율하는 컨트롤러 역할은 여전히 필요하다. 모듈 간 인터페이스 관리의 복잡성, 오류 추적 및 디버깅의 어려움, 운영 및 유지보수 부담, 불명확한 입력 처리의 난점 등 모든 고전적 문제를 다 다시 다루어야 한다. 결국 하이브리드 시스템일 뿐이다.

독 안에 갇힌 인류는 비형식체계(informal system)인 감각과 상징과 언어만으로 별을 헤아리며 마주친 문제들을 풀기 위해 수많은 하위 문제를 해결하는 여러 형식체계들(formal systems)을 개척했다. 논리, 수리, 기하, 물리 등이다. 우리가 살아가는 우주는 단일한 물리적 실재겠지만 감각, 상징, 언어와 인식능력의 한계로 우리는 작은 층위들로 쪼개어 분석적 이해를 시도할 따름이다. 별을 헤고픈 독 안의 인류는 한 번에 한 층위만 고려하는 하위 형식체계들을 어설프게나마 이어줄 도구로서의 비형식 체계인 '언어의 세계'로 다시 여행하기 시작했다.

김주한 서울대 의대 정보의학 교수·정신과전문의 juhan@snu.ac.kr

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.