KT, K-데이터얼라이언스 출범···'한국적 AI' 육성
한국어 고품질 데이터 공유해 AI 경쟁력 강화 목적
[시사저널e=김용수 기자] KT가 인문, 교육, 언어, 언론 등 기관들과 한국적 인공지능(AI) 경쟁력 강화를 위한 ‘K-데이터 얼라이언스’를 출범시켰다. 한국적 AI 경쟁력의 핵심 자산이자 AI 모델 성능을 좌우하는 올바르고 신뢰할 수 있는 고품질 데이터를 공유해 AI 경쟁력을 확보하겠단 전략이다.
16일 KT는 서울 송파구 소피텔앰배서더서울에서 고려대 민족문화연구원, 두산디지털이노베이션, 아이스크림에듀, 중앙일보, 한국교육방송공사(EBS), 한글학회 등과 ‘K-데이터 얼라이언스’ 협약을 체결했다고 밝혔다.
이날 협약식 이후 AI 데이터 생태계 구축에 대해 논의하는 자리에서 KT는 K-데이터 얼라이언스의 주관사로서 한국적 AI 철학을 구현하기 위해 한국어 고유 표현과 사회·문화적 맥락, 사용자의 다양한 목적을 반영할 수 있는 고품질 데이터의 중요성을 강조했다. 또 각 분야에서 선도적 역할을 하고 있는 대표 기관들이 보유한 한국적 데이터를 공유하는 것이 어떤 의미와 가치가 있는지 설명했다.
KT 관계자는 “K-데이터 얼라이언스 결성은 한국적 AI의 구현과 안전하고 가치 있는 활용에서 나아가 협력과 개방을 통한 확산으로 함께 성장하고 발전하는 생태계를 조성해 글로벌 경쟁력을 갖추겠다는 사명감과 공감대가 원동력이 됐다”고 강조했다.
향후 각 기관은 한국적 AI를 위한 데이터 구축, 한국적 AI 관련 도메인 선도 사례 창출, 한국적 AI 관련 활동·성과에 대한 홍보 및 대외 확산, 한국적 AI 데이터에 기반한 인문·사회분야 연구를 위해 긴밀한 상호 협력을 이어갈 예정이다.
또 KT는 각 기관이 보유한 콘텐츠들을 선별해 고품질 데이터로 가공하고, AI가 학습할 수 있는 형태로 구조화해 독자 개발 모델인 믿음 2.0, 마이크로소프트 협력 기반 GPT 모델, 이외 오픈소스 모델 등의 한국적 AI 모델과 서비스로 연결한다.
특히 EBS가 보유한 검증된 학습·교양 콘텐츠와 함께 질문-답변 형태로 구조화된 피드백 기반 학습 데이터는 AI 모델의 핵심 기능인 추론 능력을 향상시킬 수 있는 최적화된 자원이다. 이는 한국어 사용자 특유의 질문 방식과 문맥을 이해하는 데 있어 매우 높은 가치를 지닌다.
중앙일보의 뉴스 콘텐츠는 한국 사회를 입체적으로 반영하는 고유한 언어 자산으로 모델의 문맥 이해와 사실 기반 응답 생성에 있어 신뢰할 수 있는 학습 자원으로 평가된 단게 KT의 설명이다.
앞으로 K-데이터 얼라이언스에 참여하는 각 기관은 KT를 구심점으로 정기 협의체를 운영하고 추진 성과를 공유하며 한국적 AI 확산을 위한 신규 과제를 발굴하는 등 실행력과 결속력을 더한다. 참여기관의 지속적인 확장을 추진해 데이터-모델-서비스로 이어지는 정교한 한국적 AI 데이터 생태계도 구축해 나갈 방침이다.
오승필 KT 기술혁신부문장 부사장은 “한국적 AI는 국가의 AI 경쟁력을 높이는 동시에 기업의 AI 혁신을 촉진하고 국민이 일상 속에서 체감할 수 있는 실용적 가치로 이어져야 한다”며 “K 데이터 얼라이언스가 한국적 AI의 지속적인 고도화와 실용화에 있어 핵심 동력이 될 수 있도록 힘을 모아 협력해 나갈 것”이라고 밝혔다.