고객사 287개‧데이터 2억건 이상 작업 노하우 보유
국내 최초 TTA ‘데이터 품질(DQ) 인증’ 획득
LLM 신뢰성 평가 SaaS 서비스 출시 계획도
[시사저널e=이창원 기자] AI(인공지능) 도입‧개발 과정의 ‘올인원 데이터 서비스(All-in-one Data Service)’를 제공하고 있는 ‘셀렉트스타(SELECTSTAR)’가 국내 AI 생태계 조성을 위한 노력에 총력을 기울이는 모습이다.
특히 셀렉트스타는 LLM(대규모 언어 모델) 신뢰성 평가 솔루션 등 분야에서 차별화된 기술력을 바탕으로 AI의 신뢰성을 한층 업그레이드하겠다는 청사진을 그리고 있다.
6일 업계에 따르면, 셀렉트스타는 지난해 4분기에만 AI 관련 3개의 상을 잇따라 수상했다. 이에 대해 국내 AI 스타트업 시장에서 독보적인 입지를 다졌다는 평가가 나온다.
앞서 셀렉트스타는 지난달 19일 ‘2024 아시아 AI대상’에서 AI 학습 데이터 구축‧판매, LLM 신뢰성 평가 솔루션 기술을 출품해 미래 성장 가능성과 혁신적 기술 잠재력을 인정받아 ‘벤처기업협회장상’을 수상했다.
또 지난해 10월 개최된 ‘Korea Promising AI Startup 2024’에서 ‘AI 클라우드 분야 대표 스타트업’으로 선정됐고, 11월 ‘제2회 인공지능 신뢰성 대상’에서도 높은 기술력을 입증하며 ‘정보통신정책연구원 원장상’을 수상했다.
특히 셀렉트스타는 ‘Korea Promising AI Startup 2024’에서 클라우드 인프라를 기반으로 AI 모델 개발·배포·관리 전 과정의 효율성과 관련해 높은 평가를 받으며 수상 기업에 이름을 올렸다.
이번 수상들과 관련해 김세엽 셀렉트스타 대표는 “셀렉트스타가 보유한 데이터 중심 AI(Data-centric AI) 기술을 바탕으로 기업들이 더 안정적으로 AI를 개발‧도입할 수 있도록 지원해온 노력이 수상으로 이어진 것 같다”며 “앞으로 출시될 LLM 신뢰성 평가 SaaS 서비스를 통해 체계적인 신뢰성 검증을 실현하고, 궁극적으로는 믿을 수 있는 AI 생태계를 조성하는 데 앞장서겠다”고 말했다.
셀렉트스타는 AI 개발‧도입을 위한 데이터 설계 컨설팅을 포함해 구축, 데이터 정비, 대형 언어 모델(LLM) 검증까지 AI 모든 단계를 지원하는 스타트업 기업이다.
현재까지 287개 이상의 고객사와 2억건 이상의 데이터 작업 노하우 보유하며 경쟁력을 강화해왔다.
셀렉트스타의 AI 데이터 비즈니스는 크게 ‘지도 학습용 데이터 구축’, ‘사전 학습용 데이터 판매’, ‘RAG(Retrieval-Augmented Generation, 검색 증강 생성)용 데이터 구조화’, ‘LLM 신뢰성 검증’으로 구성된다.
지도 학습용 데이터 구축 서비스는 셀렉트스타의 솔루션(전문 도메인 작업자, 크라우드 워커, 자동 생성‧가공 검수 기술, QC 기술)을 통해 고객 요구사항에 부합하는 고품질 AI 데이터를 구축한다.
사전 학습용 데이터 판매 서비스는 개인정보, 저작권 등 모든 라이선스가 해결된 대용량 고품질 데이터를 판매하고, RAG용 데이터 구조화 서비스는 RAG기반 LLM 도입을 위한 최적의 형태로 지식 데이터 구조를 설계하고 파싱(Parsing)‧청킹(Chunking) 서비스를 제공하는 문서 데이터 정비 서비스다.
LLM 신뢰성 서비스는 AI의 성능과 안전성의 기준을 설계하고, 평가 데이터 구축과 레드티밍(red teaming)을 통해 LLM 신뢰성을 검증한다.
셀렉트스타 비즈니스의 또 다른 축인 AI 솔루션 비즈니스는 ‘챗봇’, ‘캐릭터 AI’, ‘AI 기술제휴’으로 구성돼 있다.
챗봇의 경우 도메인 맞춤 데이터와 최적의 인프라, 난이도 맞춤 질의‧응답 기능을 통합해 최적의 RAG 기반 LLM 챗봇을 구현하고, 캐릭터 AI 서비스로는 애플리케이션을 통해 아이들이 좋아하는 캐릭터와 실시간으로 상호작용이 가능한 AI 캐릭터 영상통화 서비스 ‘모모잼’을 운영하고 있다.
또 IP 제휴 비즈니스, 페르소나 LLM을 활용한 제휴 서비스 등 AI 기술로 ‘모델 맞춤 서비스’를 제공 중이다.
최근에는 국내 최초로 한국정보통신기술협회(TTA)로부터 데이터 품질 인증(DQ 인증)을 획득하기도 했다. DQ 인증을 획득한 ‘LLM 무해성 평가 데이터’는 LLM이 생성하는 답변의 무해성을 평가하기 위한 벤치마크로 곧 공개될 셀렉트스타의 LLM 신뢰성 평가 SaaS(서비스형 소프트웨어) 서비스에 공인된 데이터 기반의 검증을 제공할 전망이다.
아울러 앞서 셀렉트스타는 지난 2023년 국내 최초로 LLM 신뢰성 평가 데이터셋 ‘KorNAT(LLM Alignment Benchmark for Korean Social Values and Common Knowledge)’을 구축한 바 있다. 특정 국가의 맞춤형 LLM이 구성원의 사회적 가치관‧기존 지식과 얼마나 일치(Alignment)하는가를 평가하는 것이 특징이다.
셀렉트스타는 “다양한 산업 분야에서 AI 모델이 원활히 작동하도록 고품질 학습 데이터를 구축·제공하고, 구축된 LLM의 서비스 품질과 안전성을 검증하는 솔루션을 제공하는 등 고객들이 한층 발전된 AI 서비스를 구현할 수 있도록 돕고 있다”고 설명했다.
이와 같은 기술력을 바탕으로 셀렉트스타는 지난 2023년 4분기 학습용 데이터 판매 서비스 런칭 후 누적 판매 금액 25억원을 돌파했고, 같은 해 10월 크라우드소싱 플랫폼 ‘캐시미션’은 누적 다운로드 40만건을 넘어섰다.
한편, 셀렉트스타는 지난 2019년 7월 Seed 투자로 4억원을 유치했고, 이듬해 9월 40억원 규모의 Series-A 투자 유치에 성공했다. 또 2022년 7월과 2023년 5월 Series-A Extension 투자로 각각 90억원, 40억원을 추가 유치했다.