음성인식, 영상인식, 검색엔진, 사기 적발 등 일상에 자리한 AI

출처=jeferrb / Pixabay

 

인공지능은 공상과학(SF) 영화에서 빠져 나와 우리 삶 가까이 다가왔다. 아이언맨 자비스, 터미네이터 스카이넷, 엑스 마키나 아바 등 영화 속 인공지능처럼 완성체는 아니더라도 그 기능 일부가 우리 삶을 채우는 기기 속에 탑재돼 있다. 

 

우리는 “시리, 날씨”라고 두 마디만 하면 스마트폰이 날씨를 알려주는 세상에 살고 있다. 자연어로 소통하는 인공지능만 있는 게 아니다. 머신러닝에 기초한 인공지능은 금융, 번역, 마케팅, 법률, 치안 등 많은 영역에서 쓰여지고 있다. 알파고, 왓슨, 시리, 코르타나, 알렉사, 비브 등 인공지능은 유명하다. 반면 기기 속에 탑재돼 삶의 질을 높이고 효용을 창출하는 무명의 인공지능도 있다.  


닉 보스트롬 옥스포드 철학과 교수는 미국 케이블 TV CNN과 인터뷰하며 “최첨단 인공지능을 우리 삶 속에 다양하게 활용하고 있다. 우리는 인공지능을 인공지능이라 인식하지 못할 때도 있다. 삶 속에서 너무 흔하게, 그리고 너무 유용하게 쓰이기 때문”이라고 밝혔다.

◇난 네가 뭘 원하는 지 알고 있다


출처=구글 페이지 캡쳐.

출처=구글 페이지 캡쳐.

우리가 검색 엔진에 키워드를 입력하고 결과를 기다리는 짧은 시간 검색엔진 인공지능은 수많은 밑 작업을 거쳐 검색 결과를 내놓는다. 구글은 크롤링(crawling) 방식으로 정보를 수집한다. 웹사이트는 유사한 내용의 웹사이트에 대한 정보, 즉 링크를 포함한다. 구글은 링크들을 타고 다른 웹사이트를 방문하면서 그 안에 있는 정보를 수집한다. 구글은 수집한 정보를 내용에 따라 분류한 뒤 자체 색인에 영구저장한다.

구글에 검색 키워드를 입력하면 구글 인공지능은 200가지 넘는 기준으로 색인 내 관련 자료를 찾는다. 그리고 어떤 정보가 더 정확한 지 순위를 매긴다. 순위를 매기는 과정에서 스팸으로 분류되는 정보들은 제외한다. 스팸은 웹사이트 내용과 관련 없지만 트래픽을 늘리기 위해 키워드를 적은 웹사이트를 말한다.

전문 내용을 검색하는 인공지능도 있다. 지난 5월 미국 법률회사 베이커&호스틀러는 IBM 인공지능 변호사 로스를 고용했다. 로스는 법률보조원 업무를 대신한다. 다른 인공지능과 달리 로스는 사건 정보를 검색하면서 해당 사건을 분석한다. 사건을 검색·분석한 뒤 의뢰 받은 법적 문제를 해결하는데 도움이 될만한 내용이나 의미를 찾아낸다.

로스는 스스로 학습하는 인공지능이다. 로스는 사건 검색을 도와주고 그 사건에 대한 피드백을 받는다. 피드백 내용은 법률 빅데이타의 일부로 쌓이고 로스는 이를 분석하고 분류해 더 정확히 법률 자문할 수 있다.

◇너의 목소리가~들려~


출처=비브 동영상 캡쳐.

출처=비브 동영상 캡쳐.

시리가 2010년 나온 뒤로 음성인식 인공지능은 놀라운 속도로 발전했다. 2013년 IBM 왓슨, 2014년 MS 코르타나, 2015년 아마존 에코와 페이스북 M, 개발 중인 비브 등 음성인식 인공지능을 탑재한 플랫폼이 확장되고 있다. 시리는 스마트폰, 코르타나는 데스크탑, 알렉사는 아마존서 개발하는 스피커, M과 구글 나우는 어플리케이션에 탑재되고 있다.

개발 단계에 있는 인공지능 중 가장 돋보이는 것은 비브다. 비브는 시리 개발진이 연구하고 있는 인공지능이다. 비브는 기존 인공지능보다 쓰임새나 기능 면에서 앞선 차세대 인공지능이다.

예를 들면 “라지 페페로니 피자”라고 말하면 시리는 피자라는 단어를 인식하고 주변 피자 가게를 검색해 알려준다. 비브는 식당을 검색하는데서 그치지 않고 주문까지 완료한다. 30분 후에 피자 가게 배달원이 라지 페페로니 피자를 들고 초인종을 누른다.

비브는 인간 비서처럼 복잡한 업무도 알아듣고 수행한다. 예를 들면 비브에게 “형 집에게 가는 길에 라자냐랑 어울리는 와인을 구해야해”라고 말하면 1/20초 안에 형 집 가는 길에 있는 와인 가게와 라자냐랑 어울리는 와인을 추천한다.

비브는 질문을 해석하고 수행하기까지 여러 절차를 거친다. ‘라자냐는 음식이고 형은 아는 사람이고 형 집은 주소’처럼 간단한 명제에서 시작한다. 비브는 라자냐 재료를 분석해 치즈, 고기, 파스타, 이탈리아 음식, 소스 같은 단어들로 분류한다. 그리고 이 재료들과 어울리는 피노누아나 카베르네 같은 와인를 검색한다. 그 와중에 형 연락처를 찾아내 그 중에서 집 주소를 파악한다. 비브는 형 집과 가까운 와인 가게를 검색하고 와인 가게에 있는 피노누아나 카베르네를 가격순으로 정리해 말한다.

이 모든 과정이 1/20초 안에 이루어진다. 사람 업무 처리 속도와 비교할 수 없을 정도로 빠르다.

◇얼굴 보면 난 네가 누군지 안다

파인드페이스 이미지 / 출처=파인드페이스 동영상 캡쳐.

파인드페이스 이미지 / 출처=파인드페이스 동영상 캡쳐.

페이스북 이용자가 인물 사진을 올리면 인공지능은 얼굴 주위에 사각형을 그린다. 사각형을 클릭하면 인공지능은 이용자가 태그할 친구를 추천한다.

페이스북 인공지능은 머신러닝 내지 지도학습을 통해 사진 속 사람을 구별한다. 페이스북에 등록된 사진들은 인공지능에게는 학습 자료다. 개발자가 사진 속 특정 부위가 얼굴이라고 정의하면 인공지능은 등록된 수백만 사진들을 학습하고 분석하면서 ‘얼굴’이란 패턴을 익히게 된다.

사진 속 인물을 태그할 때 페이스북 인공지능은 해당 인물의 얼굴형과 인물간 관계도를 저장한다. 다음에 사진이 올라오면 인공지능은 사진 속 얼굴 공통점을 분석하고 공통점이 많다면 태그를 추천한다.

우리가 자주 사용하는 페이스북 인공지능 기능이 태그추천에 머물렀다면, 러시아 “페이스북”이라고 불리는 파인드페이스는 좀 더 확장된 기능을 가진 인공지능을 사용한다. 길거리에 오가는 인물을 찍어 파인드페이스에 올리면 인공지능이 얼굴을 분석하고 SNS서버 내부에 저장된 사진 중 유사한 인물을 찾아낸다. 러시아 경찰은 파인드페이스를 이용해 강력사건 용의자 신상정보를 알아내 검거하기도 했다.

페이스북이 야심차게 준비한 모멘츠도 파인드페이스랑 크게 다르지 않다. 사진을 찍었을 때 사진에 찍힌 인물들을 자동으로 태그해주는 기능을 가진 앱이다. 단체 사진을 찍었을 때, 일일히 태그했어야 하는 과거 페이스북 기능과 달리, 모멘츠는 사진에 찍힌 인물들을 얼굴인식 인공지능을 통해 자동 분류하고 태그한다. 비록 유럽에서는 사생활 침해로 받아들여 자동 태그 기능이 금지된 채 2016년 상용화했다. 미국에서는 2015 년부터 사용되고 있다.

인공지능은 얼굴 말고 다른 사물도 인식할 수 있다. 페이스북은 시각장애자를 위해 사진 속 물체를 자연어로 설명하는 인공지능을 개발했다. 얼굴을 인식할 때처럼 인공지능은 빅데이터를 이용해 선글라스, 사람, 책 등 사물을 분류한다.

구글 이미지 검색도 비슷한 인공지능 기술을 이용한다. 구글 이미지 연구팀 척 로슨버그는 사진 내 물체를 2000개 이상 카테고리로 분류하고 카테고리당 5000여개 사진을 구글 인공지능에게 보여줬다고 밝혔다. 구글 인공지능은 사진 빅테이터 분석해 우리가 검색 이미지를 올리면 이에 해당하는 카테고리가 들어간 사진들을 검색해 보여준다.

인공지능은 영상도 편집할 수 있다. 구글은 지난 6월 영상과 사진 편집을 지원하는 모션스틸즈라는 앱을 공개했다. 심하게 흔들려 깨진 영상들을 보정하고 편집하는 앱이다. 또 여러 컷을 연이어 찍은 개별 정지 사진들을 영상으로 만들기도 한다.

개발자 켄 콜리와 마티아스 그룬드만은 직접 편집한 영상 수백만개를 데이터로 사용했다고 밝혔다. 인공지능은 그 데이터를 분석하면서 화면을 안정시키고 영상을 부드럽게 만드는 방법을 찾는다. 그 방법을 새로 올린 영상에 적용시켜 영상을 부드럽게 만든다.

◇인공지능, 스팸 걸러내고 답변도 하고

구글 스마트 답변 시스템 / 출처=구글 리서치 블로그.

구글 스마트 답변 시스템 / 출처=구글 리서치 블로그.

 

인공지능은 이메일 스팸을 걸러내고 스스로 이메일에 답변을 보내기도 한다. 이 부문에선 구글이 가장 앞서 있다. 구글 개발자 발린트 미클로스는 “구글 지메일은 스팸을 잘 막아 사랑받는다”라고 밝혔다.

구글은 평판 시스템을 사용해 스팸을 찾아낸다. 이용자가 특정 메일을 스팸 메일로 분류하면 구글은 해당 메일이 온 IP와 도메인 주소를 통계 자료로 저장한다. 특정 IP와 도메인이 반복적으로 스팸 메일을 보내 신고가 들어오면 구글 인공지능은 해당 IP와 도메일 ‘평판’ 등급을 낮춘다. 인공지능은 평판이 극도로 낮은 IP 주소에서 온 메일을 자동으로 스팸으로 분류한다.

IP 주소에 대한 평판은 변할 수 있다. 구글 인공지능은 피드백을 통해 평판을 조정한다. 이 모든 과정을 통해 인공지능은 스팸을 구분하는 법을 배운다. 또 평판과 키워드 학습을 통해 스팸인지 아닌지 확률적으로 계산한다.

2015년 11월 서비스하기 시작한 구글 스마트 답변 시스템 역시 인공지능을 사용한다. 스마트 답변 시스템은 검색 인공지능과는 다르다. 구글 개발자 제프리 힌튼은 “개가 ‘앉아!’라는 말을 이해 못하듯 검색 인공지능은 검색 단어를 이해하지 못한다”고 밝혔다.

제프리 힌튼과 다른 개발자 그렉 코라도는 구글 스마트 답변 인공지능은 “생각 벡터를 통해 문장을 이해할 수 있다”고 말한다. 생각 벡터란 문장 내 단어들에 일련번호(벡터)를 매기는 일이다. 하지만 구글 스마트 답변 인공지능은 단어가 가지고 있는 사전적 의미에만 집중하거나 매달리지 않는다.

예를 들어 개는 ‘앉아’라는 단어를 특정 행동으로만 인식하지만, 구글 인공지능은 ‘앉다’라는 동사가 포함된 수많은 문장들 속에서 그 문맥을 파악할 수 있다. 예를 들어, 인공지능이 생각벡터를 통해 문장을 분석할 때 “내일 시간 나요?” 문장과 “내일 괜찮아요?”라는 문장을 동일한 의미로 해석한다.

그렇게 문장을 해석한 인공지능은 답변을 추천해준다. 사람이 단어를 하나하나 써가듯이, 인공지능도 한 단어씩 벡터간 관계를 고려하여 문법에 맞게 쓰는 과정을 거친다.

◇통·번역사 조만간 실업자 신세

번역 이미지 / 출처=마이크로소프트 블로그.

번역 이미지 / 출처=마이크로소프트 블로그.

인공지능은 번역할 수 있다. 번역 인공지능을 만드는데 자주 사용되는 기술은 ‘통계적 기계 훈련(SMT)’이다. SMT 기반 인공지능이 문장을 번역할 때, 단어를 하나하나 번역하기보다 문장 패턴을 파악하고 그 패턴 단위로 번역한다.

인공지능은 번역을 끝낸 문서들을 보고 문장 내 패턴을 배운다. 옥스포드대학 기술공학 교수 베네딕트 프레이와 마이클 오스본은 “6개 언어로 발표되는 유엔 문서들을 보고 배우며 번역 인공지능이 비약적으로 발전했다”고 평가했다. 인공지능이 문장을 번역할 때, 그 문장에 존재하는 패턴을 다른 언어에 있는 유사한 패턴으로 바꾼다. 그리고 그 원문이 번역이 제대로 됐는지는 기존 번역된 문서들을 참고하고 피드백을 받아 판단한다.

마이크로소프트는 2월 오프라인에서도 지원되는 번역 앱을 공개했다. 우리가 직접 문장을 기입해도 번역할 수 있지만, 길거리에 있는 표지판을 보고 사진을 찍어 올려도 번역 해준다. 사진으로 글자를 인식하는 인공지능과 번역 인공지능이 만나 생긴 결과이다.

◇인공지능, 의사와 약사 도우미

뇌스캔이미지 / 출처=메디마치 페이지 캡쳐

메디마치가 개발한 의료용 인공지능이 뇌졸증 환자의 뇌 CT 사진에서 출혈 부위(빨간 선)을 표시하고 있다. / 출처=메디마치 페이지 캡쳐

 

인공지능은 건강 관리에도 기여한다. 심박수나 혈압을 재고 걷거나 뛴 거리를 측정하는 기능은 상당히 보급됐다. 이젠 질병 유무를 파악하고 치료약까지 추천하는 기능까지 수행한다.

의학 분야 인공지능을 개발하는 스타트업은 많다. 미국·이슬라엘 합작사 메디마치는 두뇌 CT나 MRI 사진을 분석하고 뇌졸증 여부를 판단하는 인공지능을 개발하고 있다. 메디마치 인공지능은 수 많은 뇌졸증 환자의 CT 사진을 머신러닝 방식으로 분석하고 학습한다. 인공지능은 뇌 사진만 보고 뇌졸증 여부를 판단할 뿐만 아니라, 피가 어디서 더 많이 흐르는지 어느 부위 상태가 더 심각한지 짧은 시간 안에 결론을 내리며 의사 판단을 돕는다. 의사보다 더 정확하고 빠르게 진단을 마칠 수 있다.

‘비홀드.AI’ 역시 망막 스캔 사진을 분석하는 인공지능을 개발 중이다. 당뇨망막병증은 망막내 혈관이 터지는 병으로 가장 빈번하게 시각장애를 유발한다. 비홀드.A는 머신러닝을 통해 당뇨망막병증 여부를 구분하는 인공지능을 만들고 있다. 비홀드 개발자 느젱가는 “비싼 대형병원 의사 진단에 비해, 우리 기술은 저소득층에게 병증 진단을 싸게 제공할 수 있다”고 밝혔다. 인공지능은 더 정확하고 빠른 의학 진단을 더 싸게 제공할 수 있다.

인공지능은 병을 진단하는데만 그치지 않는다. IBM 왓슨 기반 의학 인공지능은 전산화한 환자 개인 건강 기록을 머신러닝을 통해 분석하고 학습하면서, 환자에게 필요한 약들을 검색하고 찾아준다.

예를 들어 의사가 특정 약을 처방할 때 인공지능은 그 약은 환자의 유전적 특성 탓에 적합하지 않다고 말해준다. 의사가 클릭하면 인공지능은 새 약을 추천한다. 죠슈아 데니 밴더빌트 대학 생명공학과 교수는 의학 인공지능이 “내 직관보다 똑똑하다”고 밝혔다. 개인 지식과 경험에 따라 오락가락하는 직관보다 통계에 기초해 판단하는 인공지능이 약을 더 정확하게 처방할 수 있다는 뜻이다.

◇택시 기사 없는 사회, 자율주행차가 만든다

구글 자율주행차 / 출처=구글 페이지 캡쳐

구글 자율주행차 / 출처=구글 페이지 캡쳐

영화 ‘다크나이트 라이즈’에서는 배트맨은 자가용 배트모빌을 홀로 터널을 주행한다. 실제로 배트모빌은 촬영 당시 운전자 없이 터널을 홀로 주행했다. 미국 우버는 영화 배경이었던 피츠버그에서 지난 5월부터 운전자 없는 차를 시범 운행하고 있다.

우버는 모바일 기기를 통해 가까이 있는 택시와 기사를 찾아주는 앱을 개발한 회사다. 구글, 볼보, 포드 같은 회사와 함께 자율주행차 관련 법을 제정하기 위해 애쓰고 있다. 우버는 궁극적으로 인공지능으로 운행하는 자율주행차, 즉 운전기사 없는 택시 서비스를 제공하려 한다.

자율주행차 연구에서 가장 앞선 곳은 구글이다. 구글 자료에 따르면 인공지능은 크게 4개 과정을 거쳐 자율주행한다. 첫째, GPS 지도와 차에 장착된 센서를 통해 자기 자신이 어디에 있는지 파악한다. 예를 들어 차가 서울 올림픽대로 2차선에 있다고 인지한다.

그 다음 주변 사물을 관찰하고 크기, 모양, 움직임을 판단한다. 사물들이 어떻게 움직일지도 예측한다. 차 주변을 지나는 보행자가 어느 방향으로 움직일지 예측하는 것이다. 이 정보들에 기초해 인공지능은 어떻게 운전할 지 판단한다. 보행자가 횡단보도를 건넌다고 예측한다면 횡단보도 앞에 차를 멈춘다. 구글 자율주행차는 여러 차례 시범 운행에서 안정적인 모습을 보여주었다.

지난 5월 불상사가 발생했다. 테슬라 S 모델 자율주행차에 탄 조슈아 브라운(40)씨가 교통사고로 사망했다. 브라운씨는 사고 당시 해리포터 영화를 보면서 운전을 인공지능에게 맡겼다. 건너편 차선에서 트레일러를 끌고 있는 트럭이 갑작스레 좌회전했고, 이를 인식하지 못한 인공지능이 속도를 멈추지 않고 직진했다.

미국 일간지 <월스트리트저널>은 지난 11일 ‘자율주행차 용 도로가 필요하다(Roads that work for self-driving cars)’ 제목의 특집 기사에서 “자율자동차는 기술적으로는 완성에 가까워지고 있다. 하지만 관련 법규나 제도를 먼저 마련해야 자율주행차를 본격 도입할 수 있다”고 지적했다.

일본 도요타, 독일 폴크스바겐, 미국 GM 등 기존 자동차 업체들도 자율주행차 용 인공지능 개발에 박차를 가하고 있는 것으로 알려졌다. 하지만 자동차 업체들은 보안상 자사 자율주행차 기술을 밝히지 않고 있다.

현대·기아차도 자체 연구팀을 꾸려 자율주행차 기술 연구에 박차를 가하고 있다. 박동일 현대자동차 전자기술센터장은 “인피니언, 프리스케일 등 반도체 회사들과 공동연구소를 운영하며 기술개발에 박차를 가하고 있다”고 말했다. 인피니언과 프리스케일은 자동차 반도체 부문에서 세계 정상급 기업이다.

◇사기 의심 거래 자동 차단

 

소매치기가 훔친 신용카드로 자기 집 근처 편의점에서 결제하려 해도 승인이 떨어지지 않는다. 인공지능이 내역을 보고 이상 거래라는 사실을 알아챈 것이다. 카드 거래 사기방지 인공지능은 이미 개발됐지만 아직 상용화하지 않았다. 


인공지능은 사기로 의심되는 거래를 차단한다. 류정우 펜실베이니아 주립대 정보과학기술과 교수는 차단 요인으로 5가지를 뽑았다. 소비자가 카드 결제할 때 인공지능은 물건 파는 사람이 믿을만한지, 거래 당시 결제자 행동 패턴(시간, 장소, IP 주소 등)은 어떠한지 본다. 또 과거 거래내역이나 구매 장소에서 활동 내역, 쿠키 정보를 종합적으로 판단해 사기 여부를 판단한다.

인공지능은 수많은 신용카드 사기 사례를 학습한다. 과거 사례랑 유사한 패턴을 보이는 거래 내역이 있으면 즉시 거래를 차단하기도 한다. 류정우 교수는 이에 대해 “이는 인간이 할 수 없는 일이다. 누가 몇 초 안에 많은 정보를 보면서 결정을 내릴 수 있겠나”라고 말했다.

인공지능은 지금도 많은 자료를 수집하고 분석하고 있다. SNS에 사진을 올리거나 구글에서 검색할 때 인공지능은 해당 정보를 축적하고 관리한다. 앞으로 인공지능이 발전할수록 우리 삶 속으로 더 깊이 파고들 전망이다.

 


저작권자 © 시사저널e 무단전재 및 재배포 금지