이성환 고려대 교수…"관련기술 통해 검색 분야도 다양한 비즈니스 기회 열릴 것"

28일 서울 그랜드하얏트 호텔에서 시사저널e‧시사저널 주최로 열린 제2회 인공지능 컨퍼런스에서 이성환 고려대 정보통신대학 뇌공학과 교수가 인공지능의 영상 해석을 통한 응용분야는 무궁무진하다고 밝혔다 / 사진=시사저널

 

인공지능의 영상 해석을 통한 응용분야는 무궁무진하다는 전망이 나왔다. 

 

28일 서울 그랜드하얏트 호텔에서 시사저널e‧시사저널 주최로 열린 제2회 인공지능 컨퍼런스에서 이성환 고려대 정보통신대학 뇌공학과 교수는 “인터넷 비즈니스 기업들은 인공지능의 영상 해석 기술을 확보하기 위해 혈안이 돼 있다"며 "검색 분야만 생각해봐도 기계가 인간 수준의 지능을 갖게 되면 트래픽 확보는 물론 다양한 비즈니스 기회가 열릴 것"이라고 말했다.

 

최근 인공지능 연구 분야에서는 딥러닝을 통한 영상질의 응답 연구가 화두로 떠올랐다. 인공지능 시스템이 응답하기 위해서는 질문 이해가 필수적이다. 그리고 이 과정에서 영상인식이 필수적이다.

 

이 교수는 "인간이 태어나서부터 외부에서 받아들이는 지식의 80%는 시각정보"라며 "시각정보가 있기 때문에 인간이 지식을 쌓을 수 있듯이 인공지능에서도 시각정보 해석이 중요하다"고 지적했다. 

 

학계에서는 오래 전부터 기계의 영상인식을 공격적으로 연구하고 있다. 데이터망을 통해 이미지 자료를 모아두고 인공지능이 올바르게 분류하는지 테스트하는 식이다. ILSVRC 라는 데에서는 1000개의 서로다른 카테고리의 샘플이 있다

 

이 교수는 "다양한 사진을 두고 이것은 의자라고 분류한다고 치면 사람이 수작업으로 분류해도 100개중 3개 정도는 틀린다"며 "현재 기술은 인공지능이 97.1%까지는 맞추는 수준까지 성장했다"고 말했다.

 

최근에는 비디오 튜링테스트도 진행되고 있다. 튜링테스트는 1950년 제시된 기계의 지능을 판별하는 테스트다. 기계가 인간과 구별이 불가능할 정도로 대화가 가능하다면 지능이 있다고 판단한다. 비디오 튜링테스트는 기계와 사람에게 글자를 보여주고 각자 자유롭게 변형한 뒤 어떤 글자 변형을 기계가 만들어낸 글자인지 찾는 방식으로 진행된다. 

 

영상기반의 질의응답 분야가 인간수준의 해석을 가능하게 하기 위해서는 아직도 갈길이 멀다는 예상도 내놨다. 이 교수는 지금 수준은 단순 딥러닝을 바탕으로 영상을 보고 대답하는 수준이라는 지적이다. 

 

이 교수는 "지금 연구 추세는 빅데이터 기반의 데이터드리븐 방식(다양한 샘플들을 통해 데이터를 쌓아 해당 영상을 인식하는 방식)의 바텀업"이라며 "똑같은 케이스가 또 나오지 않으면 설명을 붙여주기 어렵기 때문에 일부학자들은 탑다운 방식도 고민하고 있다"고 설명했다.

 

 

저작권자 © 시사저널e 무단전재 및 재배포 금지