-“국내 인공지능 기술력 매우 낮아...인재 양성이 최우선 과제” -“인공지능 위해성에 대한 우려보다 인간 인성 교육부터”

김선 서울대 생명연구소장 겸 컴퓨터 공학과 교수가 KT 생명정보 실용화센터(IBIS)에서 시사저널 경제매체 시사비즈와 인터뷰를 가졌다. / 사진 = 김재일

김선(54) 서울대 생물정보연구소장은 생물정보학 국내 최고 석학이다. 김선 교수는 서울대 생물정보 교육, 연구에 기여해달라는 요청에 20년 넘는 미국 생활을 뒤로한 채 한국행을 결정했다. 생물정보학은 컴퓨터를 이용해 생물학, 의학 등을 연구하는 융합학으로 국내 연구 수준은 매우 낮다.

 

김선 교수는 서울대 컴퓨터공학부 교수이기도 하다. 지난해부턴 서울대 KT실용화 센터를 총괄하기 시작했다. 2001년부터 2009년까지 미국 인디애나 대학교 컴퓨터정보학 부교수, 2009년부터 2011년까지는 학과장을 역임했다. 1998년부터 2001년까지는 미국 듀퐁중앙연구소 선임 연구원으로 근무했다.

김선 교수는 과학 학술 저널 매서드(METHOD)와 국제 데이터마이닝과 생물정보학 저널(International Journal of Data Mining and Bioinformatics)의 편집자를 겸임 중이다. 그 외 ACM SIG Bio 생물정보협회 이사, 국제전기전자기술협회 기술위원회 컴퓨터 생명학 부의장 등을 맡고 있다.

김선 교수는 “국내 생물공학 연구 개발 수준을 끌어 올리기 위해 한국에 돌아왔다. 20년 미국 생활을 정리하고 돌아 오는 결정이 쉽지 않았다. 정부와 대중이 갈수록 중요해지는 생물정보학에 대해 관심을 갖지 않는 것이 안타까웠고 국내 생물정보학 발전에 기여하고자 귀국을 결정했다”고 말했다.

그는 “당시 서울대는 생물정보 연구, 교육 경험이 많은 교수가 필요 했다. 국내에서 의학과 컴퓨터학을 통합적으로 이해하는 인력이 매우 적기 때문이다. 기술력을 갖춘 인재 양성은 연구소의 주된 목표 중 하나”라고 덧붙였다.

다음은 김선 교수와 일문일답.

김선 서울대 생명연구소장 겸 컴퓨터 공학과 교수가 KT 생명정보 실용화센터(IBIS)에서 시사저널 경제매체 시사비즈와 인터뷰를 가졌다. / 사진= 김재일

 

-생물정보학과 컴퓨터공학은 무슨 관련이 있나.

생물정보학과 컴퓨터공학의 가장 큰 연결고리는 빅데이터다. 컴퓨터 알고리듬(algorithm, 문제해결 위한 규칙과 절차)은 휴먼지놈(human genome, 인간 유전체)를 해독하는데 필수다. 휴먼지놈은 32억개 염기 서열을 가진다. 육안으로 보이지 않는 세포의 염기 서열을 한 번에 해독하기는 불가능하다. 보통 500개 단위로 분석한다. 휴먼지놈 프로젝트는 무작위로 섞여있는 32억개 휴먼지놈 퍼즐을 맞추는 작업이다.

컴퓨터의 머신러닝(machine-learning, 기계가 스스로 학습하는 능력)이 없으면 휴먼지놈 해독은 불가능하다. 휴먼지놈 데이터 양은 엄청나다. 데이터를 분석하고 유추하기 위해서는 컴퓨터가 절대적으로 필요하다.

-생물정보학과 인공지능은 무슨 관련이 있나.

인공지능 기능 중 머신러닝이 있다. 머신러닝은 빅 데이터를 기반으로 한다. 예를 들어 암 환자 유전자의 위치, 기능, 특성 등을 정상인의 유전자와 비교할 때 머신러닝 기술은 필수다.

-중점적으로 쓰는 인공지능 기술은.

러닝머신과 데이터마이닝(data-mining)을 중점적으로 활용한다. 새로운 인공지능 기술을 개발하진 않는다. 응용 분야 특성에 맞춰 기존 인공지능 기술을 혼합해 사용한다. 일명 맞춤 과학이다. 빅 데이터를 한 가지 인공지능 기술로 풀기는 불가능하다. 서울대 생물정보연구소는 생물정보학 필요에 맞춰 인공지능 알고리듬을 수정 보완하는 작업을 수행하고 있다.  

-듀퐁중앙연구소에선 무슨 연구를 수행했나.

1998년 큰 야망을 갖고 듀퐁중앙연구소에 입사했다. 화학업체 듀퐁은 생명공학 업체로 변신 꾀했다. 화학 산업은 오염을 줄이기 위해 친 환경적으로 화학 물질을 생산해야 한다. 나는 박테리아 염기 서열을 연구해 조작하는 기법을 연구했다. 하지만 듀퐁은 회사를 생명공학 업체로 변신하는데 실패했다. 투자 규모에 비해 단기 성과가 너무 적은 탓이었다. 화학 산업은 투자 성과가 바로 나오지만 생명공학은 오랜 투자가 필요하다.

-국내 생물정보학 기술력의 현주소는.

국내 생물정보 연구는 두가지 점이 아쉽다. 첫째, 머신러닝 분야의 근간 이론을 연구하는 학자가 매우 적다. 둘째, 단기 성과를 노리는 응용학에 대한 투자가 대부분이다. 융합 학문은 장기 투자와 연구가 필수다. 국내 생물정보학자는 많아야 5명정도다.

-연구소 장·단기 목표는.

새 생물정보 플랫폼을 만들고 전문 인력을 양성하기가 연구소의 단기 목표다. 과거 의학, 생물학은 가설 중심 학문이었다. 데이터 측정이 불가능한 탓에 개인의 경험과 직관력으로 가설을 검증해나갔다.

이제는 의학, 생물학, 약학, 수의학 등 모든 생물 관련 분야가 데이터 중심 학문이다. 인공지능을 활용한 빅데이터 분석이 가능해졌다. 여러 학문이 빅데이터로 연결되면서 하나의 학문으로 풀 수 있는 문제는 사라졌다.

국내 생명 관련 연구는 ⅓ 이상이 의료에 몰려있다. 아직까지 분석력이 데이터 양을 못 따라가는 게 큰 문제다. 연구소의 장기 목표는 의료 업계와 협업하면서 새로운 생물학과 의학을 만드는 것이다.

-새로운 의학이란.

새로운 의학의 사례로 유방암을 들 수 있다. 미국 배우 안젤리나 졸리는 유방과 난소를 절제했다. 그는 BRCA1 유전자 변이에 대한 가족력이 있다. 이 유전자 변이가 생기면 일반 유방암과는 달리 치유가 거의 불가능하다.

BRCA1는 유전자 손상 복원관련 유전자다. BRCA1 변이가 생기면 유방암 발생률은 매우 높아진다. 현재 의료 기술은 BRCA1 유방암을 치료하기에 역부족이다. BRCA1 유전자 변이에 대한 이해가 매우 낮고 변이의 원인 파악이 안 되기 때문이다.

BRCA1처럼 특정 유전자에 대한 연구는 새로운 의학이자 맞춤 과학이다. 맞춤 과학은 어마어마한 양의 정보를 필요로 한다. 휴먼지놈 1개의 염기는 4가지다. 따라서 전체 데이터 양은 4의 32억승이다. 이 많은 데이터를 해독하는데 대용량 머시러닝 기술은 필수다. 언젠가 BRCA1 변이 유방암 등도 치료가 가능해 질 것이다. 빅 데이터 분석이 가능해진다면 말이다.

-인공지능이 의료 산업에 쓰이는 사례는.

암 치료용 컴퓨터 알고리듬인 IBM 왓슨(Watson for Oncology)이 좋은 예다. 왓슨은 프로그램에 불과하지만 머신러닝으로 스스로 학습해 의대 인턴, 레지던트 과정을 마쳤다. 전 세계 다수 병원이 왓슨을 사용하고 있다. 국내 병원도 왓슨 도입을 긍정적으로 검토하고 있다. 지나치게 비싼게 흠이다. 소프트웨어 한 카피에 1억원가량이다. 연간 유지비는 더 나갈 것으로 추정된다.

-암 치료용 왓슨이 전문의보다 더 뛰어난 점은?

답하기 어려운 질문이다. 머신러닝은 사람이 연구한 데이터를 기반으로 작동한다. 따라서 기계가 사람을 뛰어넘기는 원천적으로 힘들다. 왓슨은 기술력의 편차가 적다는 장점을 갖고 있다. 왓슨은 국내 최고 대학병원 암 전문의 수준에는 못 미쳐도 언제 어디서나 평균 이상 치료 성과를 낸다. 지금 의사의 판단을 돕는데 유용하게 쓰이고 있다.

-인공지능의 위해성에 대한 우려가 나온다.

인간이 인공지능의 용도를 결정된다. 악마는 인공지능이 아니라 그것을 쓰는 인간이다. 인공지능은 인간이 좋은 의도로 쓰면 좋게, 나쁜 의도로 쓰면 나쁘게 쓰인다. 인공지능에 대한 도덕성을 우려하기보다 인간 인성 교육에 더 신경 써야 한다.

-국내 생명 산업 분야의 투자 현실은 어떤가.

삼성전자는 수십년 전부터 생명과학에 투자해왔다. 생명과학은 투자 성과를 거두는 데 최소 15~20년이 걸린다. 하지만 대부분 업계는 2~3년 내에 수익이 나오길 기대한다. 듀퐁 사업이 실패한 이유도 여기에 있다. 지속적 투자가 있어야 체계적인 인프라를 구축할 수 있고 그에 따른 성과도 나온다. 국내외를 망라하고 대부분 업계는 단기적 성과에만 매달리고 있다. 국내 상황은 특히 심각하다.

-정부 지원은 어떤가.

말 나온 김에 언급하겠다. 나는 미국과 한국 정부의 연구 과제를 모두 경험했다. 한국은 융합 학문에 대한 관심과 이해가 매우 떨어진다. 정부가 주도한 연구 분야 중 컴퓨터공학과 생물학 같이 여러 학문을 융합한 프로그램은 매우 적다.

정부는 아직 DNA 유전자 배열 기구를 의학 기기로 인정하지 않고 있다. 미국에서는 보험회사까지 유전자 검사 비용을 지불한다. 전 세계 트렌드를 따라 우리나라도 빠른 시일 내에 유전자 배열 기구를 의료 기기로 인증해야 한다.

현재 서울대 유방암 센터장과 한국형 항암화학요법 실험을 진행중이다. 보건복지부가 주관하는 연구 과제다. 과제가 끝날 쯤이면 유전자 서열 해독 기구도 의료 기기로 인증될 것으로 기대된다.

언젠가 모든 유전자 연구 관련 기기가 의료 기기로 인정될 것이다. 전 세계 흐름이라 그 시기가 언제냐에 따라 생물정보학의 미래가 달려있다.

-생물정보학 발전을 위해 필요한 것은.

융합에 대한 인식부터 바꿔야 한다. 여러 가지 학문에 대한 지식을 합치면 융합 정보라고 착각한다. 이는 누구나 할 수 있는 단순 노동이며 경쟁력도 없다. 높은 기술력이 뒷받침되지 않는 한 아무리 많은 지식을 가져도 쓸모 없다.

비전만 있다고 스마트폰을 만들 수 없듯이 깊이 있는 기술력이 있어야 융합학도 발달할 수 있다. 스마트폰에 대한 필요성은 누구나 가질 수 있다. 그것을 현실화할 사람이 필요한 것이며 그 사람은 기술력에 대한 이해도 있는 사람이다.

아직 우리나라 정부는 융합적 기술력에 대한 관심과 이를 뒷받침할 제도가 부족하다. 융합적 기술력을 갖춘 인재 양성이 우리가 당면한 가장 중요한 임무다.  

저작권자 © 시사저널e 무단전재 및 재배포 금지