자이냅스, 30분 분량 정보 1/7 이하 수준으로 줄여

사진 = 시사저널e
사진 = 시사저널e

[시사저널e=송주영 기자] 4분동안 64문장을 들으면 화자의 말하는 어조, 크기, 자주 쓰는 단어, 감탄사 등 습관을 따라 하는 인공지능 기술이 개발됐다.

인공지능업체 자이냅스는 25일 인공지능이 화자의 말을 흉내 내는데 걸리는 학습 시간을 기존 300 문장 분량을 64문장으로 줄였다고 밝혔다. 64문장을 30분간 학습하면 인공지능이 그 사람의 말투를 따라할 수 있다.

주동원 자이냅스 대표는 “인공지능 음성합성에서 중요하게 얘기되는 것이 학습시간”이라며 “최근에 사람 흉내를 내는데 필요한 문장을 64문장까지 줄였다”고 설명했다. 과거 인공지능은 30분 분량의 정보를 12시간 동안 학습해야 말투를 따라할 수 있었다.

분석시간을 줄이는 것은 분석 비용과도 연관된다. 인공지능은 대용량 데이터를 다루기 때문에 분석에 클라우드를 활용한다. 클라우드는 서버를 사용한 만큼 과금을 하는데 30분에서 4분으로 시간을 줄이면 비용을 1/7 수준으로 줄일 수 있다.

인공지능이 목소리를 흉내 내는 단시간 기록으로는 미국에서 7초만에 ‘내 목소리’를 찾아주는 서비스가 있다. 이 기술은 70만건 이상의 목소리 데이터를 저장하고 이중에 가장 비슷한 소리를 매칭하는 기술을 이용했다.

자이냅스 기술은 대량의 목소리 데이터를 저장하지 않고 화자의 목소리만 듣고 그 특징을 인공지능이 찾아준다는 데서 다르다.

이 회사는 챗봇 등을 개발하는 인공지능 회사로 작년부터 음성합성 분야에 뛰어들어 앱을 개발중이다.

회사 유튜브 채널에 이낙연 민주당 대표, 홍준표 무소속 의원, 이재명 경기도지사 등의 목소리를 닮은 인공지능이 모여 중국집 메뉴를 놓고 치열하게 토론하는 영상을 만들어 게시하기도 했다.

자이냅스는 이달 안에 인공지능 음성합성을 이용한 알람 앱을 공개한다. 가수 목소리로 모닝콜을 하는 앱이다. 이 회사는 신인그룹 UNVS에 투자하는 등 엔터테인먼트와 인공지능을 결합한 서비스를 개발했다.

연예인 목소리를 활용한 인공지능 서비스는 최근 주목받는다. 엔씨소프트는 최근 강다니엘, 아이즈원 등 연예인 목소리로 원하는 시간과 상황에 맞춰 전화를 할 수 있는 인공지능 서비스를 공개하고 내년 서비스를 시작할 계획이라고 밝혔다. 자이냅스도 내년 2월 목소리를 활용한 새 앱을 내놓을 계획이다.

자이냅스는 지난 2017년 자연어처리분석(NLP) 기술로 시작한 인공지능 업체다. NLP 분석은문자를 보고 해석해 의미를 파악하는 작업이다. 지난해 음성시장에 진출했고 앞으로 표정과 몸짓 등을 분석하는 영상 시장에도 진출할 계획이다.

인공지능 기술력을 인정받아 삼성이 지원하는 스타트업 육성 프로그램 ‘C랩’에 선정되기도 했다.

자이냅스의 주 수익원은 챗봇과 빅데이터 전처리 시스템이다. 서울대 등에 챗봇을 공급했고 산업연구원, 수출입은행, 미래에셋대우증권 등 프로젝트를 수행했다.

저작권자 © 시사저널e 무단전재 및 재배포 금지