인공지능·자율주행차에 필수…사용자경험 가장 중요
인공지능과 자율주행차 기술이 발달하면서 ICT(정보통신기술) 업체들이 음성과 음향에 관심을 쏟고 있다. 음성인식 서비스는 이미 상용화 단계에 들어섰다.
특히 언어 차이가 음성인식 서비스의 확산를 막는 장벽이다. 이로 인해 오히려 국내 기업에겐 새로운 기회가 생기고 있다.
SK텔레콤은 8월 31일 음성인식 서비스 누구(NUGU)를 내놓고 일부 사용자에게 시범서비스하고 있다. 현재 인공지능은 궁극적으로 모든 능력에서 인간처럼 기능해서 인간 대신 일할 수 있는 시스템을 목표로 개발하고 있다. 인간이 소통하는 가장 편리한 방식이 언어라는 점에서 음성인식은 모든 신기술이 대중 서비스로 발전하는 가교 역할을 한다.
누구는 우선 원통 모양의 사물인터넷(IoT) 허브(Hub) 기기에 탑재됐다. 이 기기는 조명, 스피커, 통신 같은 기본 기능을 갖췄다. 사용자는 기기와 대화를 통해 조명을 켜거나 음악을 듣고 음식 배달을 주문할 수도 있다.
데이터 분석 전문 기업 솔트룩스도 23일 음성인식 기능을 담은 인공지능 오픈 플랫폼 아담(ADAMs)을 공개했다. 이경일 솔트룩스 대표는 발표를 시작하면서 아담에게 언어로 정보 검색을 지시하는 모습을 시연했다.
IBM이나 아마존 같은 세계적인 기업도 음성인식 인공지능 서비스를 내놓고 있지만 아직 영어권에서 사업을 하고 있다. 인공지능 소프트웨어가 사람 말을 알아들을 정도로 한 언어를 인식하는 데는 최소 수년의 기간이 걸리기 때문이다. SK텔레콤은 2012년부터 자연어 처리 기술을 개발해왔다.
어린 아이가 직관적으로 습득하는 언어를 컴퓨터가 이해하기 위해서는 문장 구조를 이해해야 한다. 이 때문에 아담에서 제공되는 언어 부문 API는 형태소 분석, 구문 분석, 개체명 인식, 신조어 분석을 비롯해 10가지로 이뤄져 있다.
10가지 인식기능과 분석 기능이 있어야 사용자 물음의 수준의 언어 서비스가 가능하다. 문장이 복잡하거나 간접 화법을 사용할 경우 고차원적인 사고를 위한 딥러닝(Deep Learning)기술도 필요하다.
음성인식 서비스의 특징은 여타 인공지능처럼 사용자가 늘고 데이터가 축적될수록 발달한다는 것이다. 한마디로 언어에 대한 경험이 많아질수록 기계가 실수하지 않는다. 때문에 음성인식 서비스 기업들은 사용자와 대화한 정보를 중앙 클라우드 서버로 불러온다. 그리고 이 정보를 통해 발전한 인공지능이 통신을 통해 다시 사용자를 돕게 된다.
그러나 아직 스마트폰을 제외한 기기나 시설에서 음성인식 서비스를 찾아보기 힘들다. 이미 중국 내 일부 관공서나 은행에서는 민원 처리 로봇을 설치해 운영하고 있다. 해당 기기 가격은 5000만원에 이르는 것으로 알려졌다. 중국 정부는 그만큼 인공지능 하드웨어에도 투자하고 있다. 사용자가 늘어야 소프트웨어 개발도 활발해지기 때문이다.
중국에 민원 처리 로봇을 공급하는 퓨처로봇(FUTUREROBOT) 관계자는 “현지 기기에 들어가는 솔루션은 중국 현지 업체들이 공급한다”고 말했다.
여가와 취미 생활이 늘면서 디지털 시대에 동영상에 밀렸던 음향의 가치가 새롭게 주목 받고 있다. 음향은 초고화질(UHD)나 가상현실(VR) 실감형 콘텐츠에 필수적일 뿐 아니라 운전자가 필요 없는 자율주행차 사용자에게도 새로운 경험을 제공할 수 있다.
손영권 삼성전자 전략 혁신센터 사장은 “삼성이 강한 비디오 쪽과 하만 음향 기술이 같이 나가면 훨씬 좋은 제품 나올 수 있는 고객 경험 제공할 것”이라면서 “미래 자동차는 스마트한 교통수단이기 때문에 지금보다 오디오나 비디오 측면에서 사용자 경험(UX)이 훨씬 더 중요하다”고 말했다.