생명연장의 꿈이 현실로…AI가 창조할 ‘호모 신테티쿠스’ 시대

2025-09-03

인간 창작물·AI 생성물, 경계 모호

생명의 언어 DNA까지 영토 확장

단백질 구조 예측해 신약 앞당기고

맞춤 ‘항암 백신’도 빠르게 찾아내

미지의 영역 ‘암흑물질’ 해독 도전

유전체 합성 ‘인간 설계’ 시대 열어

자연선택이란 진화의 굴레 벗어나

질병·노화 극복, 무결점 인간 생성

AI의 힘을 빌려 다시 쓰일 인류

우리는 어떤 ‘인간’을 바라고 있나

AI는 ‘입력’될 내용에 따라 작동

미래는 우리 선택에 따라 달라진다

알파고(AlphaGo)가 이세돌 9단에게 거둔 승리는 많은 이들을 충격에 빠뜨리며 학계와 산업계에 딥러닝 열풍을 일으켰다. 그러나, 인공지능(AI)이 우리의 실생활을 파고든 계기는 알파고가 아닌 Chat(챗)GPT의 등장이었다. ChatGPT의 T는 transformer 즉 변환기를 의미한다. 현실 세계의 정보를 입력받아 컴퓨터가 처리할 수 있는 데이터로 변환하고, 연산을 통해 도출된 결과를 다시 현실 세계의 정보로 변환하여 출력해 주는 역할을 한다. 특히 언어라는 정보를 다룸으로써 인간과 대화가 가능해진 것이 우리의 삶에 큰 영향을 끼치는 요인이다.

알파고 때는 별로 문제의식이 없던 사람들도 자신들의 일이 되기 시작하자 이제서야 위기의식을 느끼고 우려의 목소리를 내고 있다. 엄청난 양의 문서를 빠르게 처리하고 분석하는 능력이 몇몇 전문 직종의 업무를 대체하는 것이 현실화되고 있다. 그뿐만이 아니다. ChatGPT의 G는 generative 즉 이것이 생성형 AI임을 뜻한다. 학습한 내용 외에 새로운 정보를 ‘창작’할 수 있다는 말이다. 문학 작품이나 학술 논문과 같은 인간의 창작물과 AI의 생성물 간의 경계는 불분명해지고 있다.

하지만 정말 본질적이고 실존적인 문제는 따로 있다. 각 개인뿐 아니라 인류라는 종으로서의 정체성마저도 AI를 통해 규정할 수 있는 시대가 온다는 점에서 그렇다. 쉽게 말해 AI가 인간의 창작물을 흉내내는 정도가 아니라 AI가 인간 자체를 창작할 가능성에 대한 이야기다. 그것은 바로 유전자(gene)가 DNA와 단백질이라는 ‘언어’로 설계되기 때문이다. DNA는 4개, 단백질은 20개의 알파벳으로 이루어진 언어 체계다. DNA로부터 단백질이 합성되는 과정을 ‘번역’이라고 부르는 것도 그런 이유다. 이러한 생명의 언어는 변환기를 통해 컴퓨터가 처리 가능한 코드로 바뀐다.

또 다른 요소는 데이터의 양이다. ChatGPT의 P는 pretraining 즉 사전학습을 의미한다. 지난 수십년간 수많은 과학자들이 DNA와 단백질의 서열과 구조를 밝혀내고 모든 정보를 데이터베이스로 만들어 왔다. ChatGPT가 엄청난 양의 인간 언어를 학습한 것과 마찬가지로, 생명의 언어를 분석하는 AI 모델들은 22억개 이상의 단백질 서열, 17만개 이상의 3차원 단백질 구조, 13만여개의 유전체에 들어 있는 9조3000억개의 DNA 글자를 학습에 활용했다(현재 출시된 모델 기준).

그중 하나인 알파폴드(AlphaFold)는 단백질의 아미노산 서열로부터 그것의 3차원 구조를 예측하는 기술이다. 알파폴드는 신약개발의 속도를 획기적으로 높일 수 있다. 질병 원인 단백질의 3차원 구조를 빠르게 규명하여 거기 결합할 수 있는 화합물을 찾아낼 수 있어서다. 그러나 AI가 발굴한 후보물질이 곧바로 약으로 쓰이는 것은 아니다. 약물의 독성과 효과를 평가하는 지난한 과정을 거쳐야 한다.

그런데 최근 혁신적인 치료법으로 주목받고 있는 항암 백신은 AI의 예측을 곧바로 치료에 적용한다는 점에서 새롭다. 백신이 암 치료를 위해 사용될 수 있는 이유는 우리 몸에서 암세포가 감염체처럼 인식되기 때문이다. 암세포는 정상세포에는 없는 수많은 단백질 조각들을 만들어 낸다. 이들은 MHC라는 단백질과 결합하여 세포 표면에 제시되어 T 세포들에 의해 외래 물질, 즉 항원으로 인식된다. 백신은 이 과정을 촉진시켜 T 세포가 암세포를 사멸시키는 것을 도울 뿐 아니라 우리의 면역 체계가 같은 암의 재발을 방지하게끔 한다.

항암 백신을 개발하기 위해서는 수많은 단백질 조각들 중 어떤 것이 해당 환자의 MHC와 결합하여 T 세포와 반응할 수 있는지를 찾아내야 한다. MHC는 사람의 단백질 중 유전학적으로 가장 다양하다. 주된 MHC 유전자 6개 각각이 최소 2000가지 이상 존재하는데 사람마다 그 6개의 조합조차 다르다. T 세포 역시 수많은 종류의 병원체에 반응할 수 있을 만큼 다양하다. T 세포 수용체의 이론적인 가짓수는 수천조를 넘어선다.

AI는 이러한 천문학적인 양의 단백질 언어를 처리하여 가장 효과적일 것으로 예상되는 항원들을 추려낸다. 다른 약물과 달리 이러한 항암 백신은 비교적 안전할 뿐 아니라 환자마다 다르게 만들어지기 때문에 각 건별 허가 절차를 거치지 않고 곧바로 치료에 사용된다. 즉 AI가 직접 약을 제조하므로 그 성능이 치료 효과에 직결된다는 것을 의미한다.

그런데 유전체에는 단백질 정보만 존재하는 것이 아니다. 인간 유전체의 30억개 DNA 글자 중 고작 1.5%만이 단백질로 번역된다. 나머지 비번역 DNA 안에는 각 단백질이 어떻게 번역되어야 하는지를 조절하는 명령어들이 흩어져 있음이 밝혀져 왔다. 그러나 오랜 진화의 세월 동안 정제되지 않고 쓰인 이 고대의 언어는 완벽히 해독하는 것이 불가능에 가까운, 유전체의 ‘암흑물질’이라고 불린다. 여기에 도전장을 내민 것이 구글 딥마인드의 알파게놈(AlphaGenome)과 엔비디아가 스탠퍼드 대학 등과의 합작으로 내놓은 에보(Evo) 등이다.

비번역 DNA가 중요한 이유는 사람 간 차이를 유발하는 변이들의 대부분이 이곳에 존재하기 때문이다. 각종 신체지수와 생리학적 수치, 수많은 질병들, 약물 반응성, 면역학적 특성들, 여러 인지기능과 행동방식, 성격이나 성향 등 5000가지가 넘는 형질들이 비번역 DNA 서열에 좌우된다는 것이 밝혀졌다. 즉 단백질 그 자체가 아니라 조절 명령어에 의해 통제되는 단백질 생성의 차이가 중요하다는 것이다. 현재까지 7000개가 넘는 논문을 통해 100만개에 이르는 변이-형질 연관성이 밝혀졌다(2025년 8월 기준).

앞으로 DNA 언어모델이 충분히 발전한다면, 마치 단백질 서열로부터 3차원 구조를 예측하듯이, 개인의 유전체 서열로부터 형질을 예측하는 것이 가능해질 것이다. 물론 사람의 형질은 매우 복잡하지만 이 역시 변환기를 통해 컴퓨터가 처리할 수 있는 코드와 사람이 이해할 수 있는 언어 사이를 오갈 것이다. 수천가지가 넘는 형질의 목록과 그에 대한 값의 나열은 인간의 두뇌가 처리하기 곤란한 형태다. 결국 ChatGPT와 대화하듯이 중요하거나 관심 있는 부분에 대한 질문과 대답이 오가는 형태가 될 것이다. 이러한 대화가 이루어지는 맥락은 자명하다. 부모가 앞으로 태어날 아이에 대해 궁금해할 때다.

1978년 첫 시험관 아기가 영국에서 태어난 후 전 세계 1000만명이 넘는 사람들이 체외수정을 통해 태어났다. 이때 배아에 대한 착상 전 유전자검사를 거칠 수 있지만 선택의 폭은 매우 좁다. 애초에 여성의 몸에서 추출할 수 있는 난자의 개수가 10개 남짓이기 때문이다. 그러나 실험실에서 난자를 대량으로 배양할 수 있다면 어떨까. 몸에서 떼어낸 세포를 줄기세포를 거쳐 난자로 전환하는 것이 가능하기 때문이다. 이미 2018년 ‘사이언스’ 연구에서는 여성 및 남성에서 유래된 세포를 난자 전 단계까지 키우는 데 성공했고, 2023년 ‘네이처’ 연구에서는 수컷 쥐로부터 난자를 만들어 다른 수컷 쥐의 정자와 수정, 정상적인 새끼 쥐를 낳는 데까지 성공했다. 이 기술이 실현되면 AI는 수백개의 배아에 대한 유전체 정보로부터 형질을 예측하여 부모에게 그중 하나를 선택하게 할 수 있다.

그러나 여기서 그치지 않는다. AI는 주어진 유전 정보를 분석만 하는 것이 아니라 수정안까지 제시할 수 있다. 결국 사람들은 이 능력에 눈을 돌리게 될 것이다. 두 사람의 조합으로는 만족할 수 없는 경우들, 즉 한 명이 치명적인 유전자를 가지고 있거나, 두 사람 모두 가지고 있는 유전자들로 인해 어떤 형질을 벗어날 수 없는 경우들 때문이다. 인공생식을 시도하기 전, 부모는 AI를 통해 자신들의 유전체 정보를 기반으로 시뮬레이션을 수행하고, 본인들이 원하는 아이를 얻으려면 어떻게 유전체를 ‘교정’하거나 ‘편집’해야 할지 살펴볼 것이다. AI는 가장 효율적으로 부모들이 원하는 바를 얻을 수 있는 DNA 수정 알고리즘을 내놓을 것이다. 유전자 가위(CRISPR)는 특히 정자와 난자의 대량 배양 과정에서 효율적으로 작동하여 AI가 추천한 서열이 정확히 반영된 배아를 만들어 낼 것이다.

하지만 이것도 끝이 아니다. 앞서 언급했듯, 생성형 AI는 새로운 정보를 만들어낼 줄 안다. 예컨대 ChatGPT는 주어진 문장을 교정하거나 편집하는 데 그치는 것이 아니라 새로운 문장들로 이루어진 한 편의 글을 창작할 수 있다. 사람들이 사용하는 언어로부터 학습한 어휘, 문법, 어감, 뉘앙스 등을 살려 문맥과 목적에 맞게 정교한 작업을 수행하는 것이다. 이와 마찬가지로, 방대한 DNA 언어로부터 생명의 원리를 제대로 학습한 GeneGPT는 새로운 문장-단백질 서열 및 조절 명령어-들로 이루어진 한 편의 글, 즉 유전체 설계도를 창작해 낼 수 있다. 그 유전체가 낳게 될 수많은 형질들에 대한 예측과 함께 말이다.

교정과 편집을 유전자 가위가 실행한다면, 창작은 유전체 합성을 통해 실현시킬 수 있다. 2016년 ‘사이언스’와 2021년 ‘셀’에는 인공생명체 탄생이 보고된 바 있다. 유전체 전체를 디자인하여 합성 제작한 이 미생물은 스스로 생명을 유지할 뿐 아니라 번식까지 가능했다. 이 연구의 책임자인 크레이그 벤터는 “정말로 새로운 생명을 창조하고자 한다면 그것은 유전자 가위로는 불가능하다”고 말했다. 물론 합성 후 발견되는 오류들을 교정할 때는 유용할 것이다.

2025년 6월에는 더욱 충격적인 소식이 발표되었다. 세계 최대 의료연구재단인 영국의 웰컴트러스트(Wellcome Trust)가 미생물이 아닌 인간의 유전체 합성 프로젝트를 시작한다는 것이었다. 단기적으로는 염색체 하나를 합성하는 것을 목표로 하지만, 궁극적으로 전체 합성을 가능하게 하려는 야심찬 계획이다. 벤터와 함께 인간게놈프로젝트를 주도했던 프랜시스 콜린스는 “DNA 읽기의 다음 단계가 DNA 쓰기가 되는 것은 당연한 수순”이라고 한 바 있다.

이 기술이 완성된다면 인간은 자연선택이라는 진화의 굴레를 완전히 벗어나 ‘설계된’ 생명체로 거듭날 수 있게 된다. 그렇게 생겨난 인류의 후손은 더 이상 호모 사피엔스라 불리지 않을 것이다. 이는 AI가 현생인류를 멸종으로 이끄는 시나리오 중 가장 희망적인 것이다. AI 업계의 시선도 추상적 개념인 인공일반지능(AGI)보다는 다양한 분야에서 실질적 변화를 만들어내는 AI+X에 쏠려 있다. 인공일반지능이 지배하는 세상이 공상과학이라면, ‘AI+생물학’은 현실의 과학이다.

이렇게 합성될 새로운 인간 종, 호모 신테티쿠스(Homo syntheticus)는 자연적인 생식, 질병과 노화를 넘어서는 것은 물론이고, 우리가 지금은 상상하지 못하는 새로운 형질들을 갖출 수도 있다. “진정한 인간성은 자연으로의 회귀가 아니라 그로부터의 탈피에 있다”는 선언과 함께 시작한 본 연재는, 인간 사회의 온갖 부조리를 ‘자연에 굴복한 유전자’와 ‘유전자에 지배당한 인간’이라는 시각으로 해부해 왔다. AI의 힘을 빌려 다시 쓰게 될 새로운 인간성은 어떻게 형성될 것인가.

그것은 AI가 아닌 우리의 선택에 달려 있다. ChatGPT처럼 GeneGPT는 프롬프트 즉 우리의 입력을 기다리며 대기하고 있을 뿐이다. 우리는 어떤 인간을 바라는가? 인류의 미래는 결국 우리의 프롬프트에 의해 쓰여질 것이다. <시리즈 끝>

■최정균 교수

카이스트 교수로 2009년부터 재직하며 인간유전체학을 연구하고 있다. 연구목표는 암을 비롯한 여러 질병의 유전학적 원인 규명과 진단 및 치료기술 개발이며, 진화론을 접목하고 인공지능(AI)을 활용하는 데 관심이 많다. 아산의학상, 과학기술정보통신부 선정 과학기술인상을 포함해 여러 학회의 학술상을 수상하였고, 과학기술한림원 선도과학자, 포스코사이언스펠로십에 선정된 바 있다.

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.