70% 완성…벌써 러브콜도 받아

19일 장준혁 한양대 융합전자공학부 교수가 직접 개발하고 있는 인공지능 스피커 플루토를 설명하고 있다. / 사진=강유진 기자

국내에 인공지능 음성인식 분야 전문 교수는 많지 않다. 게다가 직접 인공지능 스피커를 개발하는 교수는 더더욱 찾기 힘들다. 장준혁 한양대 융합전자공학부 교수를 만나 인공지능 보릿고개를 넘어 현재 인공지능 스피커 개발하기까지의 이야기를 들었다. 그의 거침없는 발언이 리더십을 대변했다.

장 교수는 현재 한국통신학회 신호처리연구회 위원장이다. 2011년에는 미국전기전자학회(IEEE)와 대한전자공학회(IEEK)가 공동 주관하는 올해의 IT 젊은 공학자상을 수상한 바 있다. 음성 및 음향 신호처리의 세계적 권위자로 알려져 있다. 현재 안식년임에도 평일은 물론 주말까지 반납하며 음성인식 기술 연구에 몰두하고 있다. 장 교수 연구팀에서는 20여 명의 학생들이 함께 연구하고 있다.

이번에 인공지능 음성비서를 비교하는 실험을 최초로 진행했는데.


인공지능 스피커 쪽을 연구하다보니 음성비서도 운용하는 엔진이 같기 때문에 비교해야겠다고 생각은 하고 있었다. 그런 찰나에 기자분께서 비교해달라고 연락을 주셔서 본격적으로 실험을 서두르게 됐다. 저희도 실제로 한 자리에서 모아놓고 실험하다보니 흥미가 있었다.

다른 곳에서도 이런 실험을 자주 하나.


이걸 굳이 왜 하려 들겠나. 힘이 드는데. 공정하게 실험하려면 여러 과정이 필요하기 때문에 자주하긴 힘들다. 구글어시스턴트 한국어 버전이 나오고 아이폰7이 도착하면 업뎃해서 제대로 실험해보고 싶다. 구글어시스턴트가 나오면 더 재밌는 실험이 될 거 같다. 음성인식에 대한 관심이 뜨거우니까.

교수실에 인공지능 스피커가 많다.


인공지능 음성기술 관련 제품이 출시하면 구비해서 자주 사용해본다. 연구 분야니 당연히 관심이 많다. SK텔레콤 누구도 써보고 KT 기가지니도 써봤지만 참 오류가 많다. 아마존 알렉사 성능을 아직 따라가지 못한다. 하반기에 하만에서 인공지능 스피커를 출시하면 5가지 정도 놓고 비교하는 실험을 또 진행하려고 한다.

연구팀이 자체적으로 개발하는 스피커는 어떤 강점이 있나.


국내 학교에서 인공지능 스피커를 만든 것은 최초다. 우리가 개발한 스피커 이름은 플루토다. 4개의 마이크를 갖고 있다. 소리를 입력하면 위치와 각도까지 알아낸다. 그런 위치를 잘 알아야 음성인식률이 높아진다. 가장 역점을 두는 기능은 화자인식이다. 지금의 인공지능 스피커는 주인을 못 알아본다. 아무나 명령을 내릴 수 있다. 플루토는 주인 목소리를 알아듣고 주인 명령에만 반응한다.

왜 이름이 플루토(Pluto)인가.


플루토는 명왕성이다. 먼 거리에서도 가능한 인공지능 스피커를 만들고 싶다. 지금 현존하는 인공지능 스피커는 거리에 제약을 많이 받는다. 최대 10m 정도에서도 무리 없이 작동하게 만들려고 노력하고 있다.

지금 어느 정도 완성됐나.


70%가 적당하겠다. 올해 안에 완성해서 선보일 예정이다. 위쪽에는 디스플레이를 넣어서 로봇 형태로 만들거다. 데모 버전은 이미 선보인 바 있다. 아직 시판도 안했는데 한 기업에서 전화가 왔다. 본인 회사에 맞는 용도로 사용하고 싶다고 팔라고 하더라. 우린 겨우 2~3대 정도 만들거다. 홍보용, 테스트용, DB(데이터베이스) 수집용 정도로만. 대량 생산이 아니기 때문에 매우 비싸다. 한 대당 1000만원 정도 비용이 들어간다.

어려움은 없나.


테스트 공간이 있으면 좋겠다. 아직 학교에서 승인을 안 해줘서 못 만들고 있다. DB가 많아야 한다. DB가 많아서 딥러닝이 돌아간다. 인공지능 절반은 빅데이터가 먹고 들어간다. 학습 데이터가 없으면 말짱 꽝이다. 실험할 때 내 방을 빌려주고 공간이 없어 세미나장에 가있거나 운동한다.

기업과 교류가 많은 걸로 안다.


다 친하다. 삼성전자, LG전자, 현대자동차, 통신사. 다 친해서 오히려 공정하고 객관적으로 평가한다. 음성인식 자체 엔진이 없는 기업은 성능이 잘 안 나오기 마련이다. 이럴 때 조언을 해주고 대책을 세워주기도 한다. 학교는 회사와 경쟁관계가 아니니까 협력해서 잘 도와주는 편이다.

인공지능 음성인식 관련 교수가 왜이렇게 없나.


구글 알파고 전에 보릿고개가 5년 이상 있었다. 학교에서 관련 교수도 잘 안뽑고 대우가 좋지 않았다. 많이 전공을 전향했다. 연구실에 대학원생도 잘 없었다. 그렇게 쪼그라들다보니 교수가 많이 줄었다. 기업들도 학교에 펀딩을 해주면서 키워야했는데 그렇게 하지 못했었다. 최근 다시 붐이 불면서 다시 일어서는 단계다.

어떻게 버텼나.


힘들었다. 심사위원들한테도 공격을 많이 받았다. 기술적 신념으로 버텼다. 이 기술은 꼭 필요하다고 주장했다. 스피커와 마이크가 있는 한 존재하는 기술이다. 자비를 털어서라도 연구를 유지하겠다는 각오였다.

학생들한테 인기가 많나.


학생들 많이 들어오려고 한다. 내년에 연구팀 들어오려는 친구들 줄서있다. 수업시간에 많이 홍보한다. 뉴스도 띄우고 배우는 것이 어디에 쓰이는지 보여준다. 어디에 써먹는지 알고 수업듣는 것하고 그냥 중요하다고 하는 거랑 많이 다르다.

목표가 있다면.


사투리도 알아듣는 기술 개발하고 싶다. 어린이, 노인의 어투도 다 처리할 수 있는 인공지능 스피커를 만들고 싶다. 내가 사투리를 쓰기도 한다.

저작권자 © 시사저널e 무단전재 및 재배포 금지