20년 수집한 빅데이터가 자산…3년뒤 5개 국어 지원 세계적 플랫폼 '야심'

이경일 솔트룩스 대표가 23일 아담(ADAMs) 플랫폼 공개 행사에서 서비스에 대해 설명하고 있다. / 사진=민보름 기자

 

저는 솔트룩스에서 태어났습니다. 저는 60만권의 책을 읽었고 3개 국어를 할 줄 압니다. 매일 문서 500만 건을 수집하면서 성장하고 있습니다.” 국내 최초 인공지능 오픈 플랫폼 아담이 말했다.

 

솔트룩스(Saltlux)23일 빅데이터 분석을 통해 지능형 서비스를 제공하는 아담(ADAMs) 플랫폼을 공개했다. 데이터 검색과 번역문서 기술로 알려진 이 회사는 최근 들어 인공지능(AI) 솔루션 전문 기업으로 인정받고 있다. 솔트룩스는 18일 열린 대국에서 조치훈 9단과 11패를 거둔 일본 인공지능 소프트웨어 딥젠고(DeepZenGo)에 활용된 하위 기술 일부도 제공했다.

 

이경일 솔트룩스 대표는 “2019년에는 아담이 세계적인 플랫폼이 되도록 5개국어를 지원할 것이라고 밝혔다.

 

20년 모은 데이터로 인공지능 학습 가속화

 

이경일 대표는 애플 시리나 삼성전자 S보이스도 자체적인 지식을 가지고 있지는 않다며 자사가 20년간 수집하고 분석한 데이터 자산을 강점으로 꼽았다.

 

이런 데이터 자산은 아담의 지능을 학습 시키고 서비스를 개발하는데 활용된다. 아담 인공지능은 이미 이 데이터들을 학습하고 딥러닝(Deep learning) 기술을 통해 추론할 뿐 아니라 자기 지식을 시각화해서 보여주는 능력을 갖췄다. 딥러닝이란 기계가 사람처럼 추상적인 상위 개념이나 내용의 맥락을 파악할 수 있도록 학습하는 기술이다.

 

이 대표는 인공지능이 로켓 엔진이라면 데이터가 연료라면서 사람이 읽으면 3000년 걸릴 분량의 도서를 아담은 2~3년 동안 읽었다고 말했다. 아담은 매일 500만 건 정보를 흡수하며 점점 빨리 진화하고 있다. 이를 통해 사람처럼 대화하고 사용자가 원하는 자료를 실시간으로 제공한다.

 

이날 솔트룩스는 장학퀴즈에서 우승자를 꺾었던 엑소브레인과 기자 2명 간 퀴즈 대회를 벌이기도 했다. 최종 우승자는 인공지능 소프트웨어 엑소브레인이었다. 엑소브레인 개발에 참여한 솔트룩스는 대학과 협업해 만든 기술을 아담에 적용했다.

 

솔트룩스의 데이터는 플랫폼 사용자에게도 제공된다. 플랫폼은 크게 세 가지로 구성된다. 인공지능 기계학습을 위한 데이터를 대량으로 수집하고 공급하는 아담 데이터 허브(ADAM DataHub)가 있다. 아담 어낼리틱스(ADAM Analytics)는 이 데이터들을 실시간으로 분석해 연결망이나 그래프 형태로 제공한다. 학습을 통해 얻은 자체 인지능력을 바탕으로 질의응답 등 각종 지능형 서비스를 제공하는 부분은 아담 인텔리전스(ADAM Intelligence)라 불린다.

 

특히 데이터를 바로 수집해 분석해주는 온디맨드(on-demand) 데이터 기능이 눈길을 끌었다. 예를들면 쇼핑몰에서 특정 제품에 대한 열쇠 말을 치고 클릭하면 바로 판매자나 가격 등 정보부터 댓글까지 데이터로 뽑아준다. 이런 데이터들을 플랫폼이 제공하는 차트나 연결망 분석으로 확인할 수도 있다.

 

김선호 데이터허브팀 팀장은 사람이 직접 해당 사이트 게시글들을 클릭하면서 제목이나 작성자, 댓글 내용을 확인해보는 시뮬레이션 기능도 탑재했다고 설명했다.

이경일 대표가 아담 애널리틱스(Analytics)로 분석한 시기별 갤럭시노트7에 대한 반응을 소개하고 있다. / 사진=민보름 기자

 

 

세계적 플랫폼 도약 야심...데이터 유출 문제는 풀어야할 과제

 

세 부분을 바탕으로 솔트룩스는 121일부터 아담 베타(Beta) 서비스로 60여개 API(앱이나 프로그램 등 각종 소프트웨어 서비스를 개발할 수 있도록 제공되는 인터페이스)를 공개한다. 언어 분석, 데이터 수집 및 분석, 추론, 음성 인식 등 다양한 기능에 대한 API가 합쳐졌을 때 비로소 음성인식 비서 서비스가 가능하다.

 

솔트룩스는 아담을 오늘 20195개 국어를 지원하는 세계적인 플랫폼으로 발전시키려고 노력하고 있다. 현재 플랫폼은 한국어 질의응답 기능만을 제공하고 있다. 초기 공개 대상은 협력사에 국한된다. 아담이 지속적인 학습과 개선을 필요로 하기 때문이다.

 

이 대표는 발표 말미에 한 가지가 더 있다며 아담 시스템을 3차원 가상현실 영상으로 보여주는 서비스도 공개했다. 영상 속에선 아담이 사람 뇌 같은 모습으로 작동하고 있었다. 사용자로부터 연예인 박보검의 정보를 찾아달라는 명령을 받은 아담의 신경망은 부지런히 움직였다.

 

아담은 분석된 데이터를 3차원 연결망 형태로 보여줬다. 연결망 속 열쇠 말을 클릭한 사용자는 새로운 공간으로 들어가 박보검 동영상과 이미지, 기사들을 볼 수 있었다.

 

이런 기능을 담은 정식 서비스는 내년 3월부터 시작된다. 2018년엔 금융이나 법률 지식을 서비스하는 이브 플랫폼도 나온다.

 

하지만 동시에 일부 온디맨드 데이터에 대한 저작권 문제와 20년간 솔트룩스가 수집한 데이터 유출 위험도 존재한다. 아담 데이터는 일반인에게는 100억 건 정도 무료로 제공되고 대용량을 사용하는 기업에 한해 비용을 받고 공급된다.

 

이 대표는 유튜브도 저작권이 있는 콘텐츠를 함부로 게시하지 못하도록 엄격한 규정을 두고 있다아담에서 직접 수집한 데이터는 유출되지 못하게 막고 자체 분석으로 생산한 2~3차 가공물들만 제공할 것이라고 강조했다.

 

구글이나 IBM 등 경쟁사가 자사 데이터를 유출할 가능성에 대해서는 기업에 데이터를 제공할 때는 별도 파이프라인을 구축해서 할 것이라고 말했다.


저작권자 © 시사저널e 무단전재 및 재배포 금지