4백만장 이미지 실험서 적중률 98.1%
네이버가 인공지능을 성인이미지를 걸러내는 작업에도 도입한다. 향후에는 음란 동영상도 인공지능이 24시간 살펴 차단할 예정이다.
네이버는 31일 자체 개발한 음란물 필터링 AI기술인 네이버 엑스아이(X-eye)를 이미지 부분에 적용한다고 밝혔다. 네이버 엑스아이는 음란 이미지를 판별하고 차단하는 역할을 한다. 기존의 필터링을 통과한 이미지와 새로 유입된 이미지와의 중복 여부도 체크한다. 만약 중복되지 않은 새로운 이미지가 있다면 검사 대상으로 삼는다.
네이버 엑스아이는 부적절한 내용을 담은 이미지가 네이버에 등록될 경우 이를 실시간으로 감지한다. 이후 대상 이미지가 음란물 기준 지수 이상인지 미만인지를 구분한다. 기준 지수 이상의 이미지 노출은 자동으로 검색되지 못하도록 차단한다. 차단된 이미지는 추후 담당자가 재검토한다.
적용에 앞서 네이버는 축적된 방대한 이미지를 형태별로 분류해 10개월 동안 인공지능을 학습시켰다. 네이버 엑스아이는 최근 버전에서 이미지 4백만장을 필터링하는 내부 실험에서 98.1%의 높은 적중률을 보였다.
이번 네이버 엑스아이 적용으로 연중 24시간 성인 이미지 실시간 감지 시스템이 구축됐다. 감지하지 못한 일부 성인 이미지는 인공지능이 학습을 통해 진화하면서 극복될 예정이라고 네이버 측은 설명했다.
네이버 엑스아이는 먼저 네모난 돋보기로 그림을 보듯 이미지의 각 부분을 순차적으로 훑어 특징을 추출한다. 이렇게 추출된 특징들로 다시 하나의 새로운 레이어를 이루고, 두 번째 레이어에 대해서도 같은 작업이 반복한다.
이미지 조각의 특징을 추출하는 것은 컨볼루션(convolution)이라고 하는데 이것을 여러 레이어에 걸쳐 반복할수록 기계 학습 기술인 딥 러닝이 가능해 진다. 최종적인 결과물을 기존 학습데이터의 카테고리로 분류해 음란성 여부를 판독한다. 때문에 이미지 데이터를 개발자가 유형별로 세분화해 학습시키는 것이 성인 이미지 필터링 기술의 핵심이다.
네이버는 앞으로 네이버 엑스아이를 동영상 필터링에도 확대 적용할 방침이다. 네이버는 건전한 인터넷 이용환경 조성을 위해 외부에도 인공지능 필터링 프로그램 공개 여부를 검토하고 있다.