정제·검증·보강 아우르는 데이터 플랫폼으로 공략
[시사저널e=송주영 기자] 인공지능(AI) 열풍 속에서 오픈소스 기반 데이터 분석 플랫폼 업체가 한국 시장에 뛰어들었다. 미국에 본사를 둔 씬스데이터랩스가 한국 지사를 열고 제조·통신·금융을 주요 공략 대상으로 삼았다.
18일 경기도 판교 바이텍씨스템 사옥에서 열린 기자간담회에서 박춘삼 씬스데이터랩스 한국지사장은 “한국은 데이터를 중시하는 시장일 뿐 아니라 AI·기계학습 진화 속도가 빠르다”며 “특히 첨단 제조기업들의 전통적인 MIS·데이터웨어하우스 운영 과정에 기여할 수 있다”고 말했다.
씬스데이터랩스가 겨냥한 첫 번째 시장은 그린플럼을 사용하는 기업이다. 대규모 병렬처리(MPP)를 지원하는 오픈소스 DBMS였던 그린플럼은 2010년 EMC에 인수된 뒤 피보탈, VM웨어, 브로드컴을 거치며 변화를 겪었다.
지난해 브로드컴이 소스코드 비공개 전환을 선언하면서 오픈소스 기반 강점을 잃자 대체 수요가 늘어날 것이란 전망이다. 박 지사장은 “그린플럼 전환을 목표로 한다”며 “100% 호환성을 제공하는 것이 최대 강점”이라고 강조했다.
씬스데이터랩스의 핵심 제품은 아파치 클라우드베리 프로젝트를 기반으로 한 ‘씬스DB’다. 대규모 분산 SQL 엔진으로, 그린플럼과 호환되면서도 페타바이트(PB) 규모 데이터 처리까지 가능하다.
‘씬스DB 엘라스틱’은 컴퓨팅과 스토리지를 분리한 클라우드 네이티브 아키텍처를 적용해 확장성과 유연성을 강화했다. 또 ‘씬스ML’을 통해 검색증강생성(RAG), 벡터 검색, 대규모 언어모델(LLM) 추론 등 최신 AI 기능을 통합 지원한다.
투샤르 페드네카르 씬스데이터랩스 창업자는 “씬스DB는 데이터 분석 플랫폼으로 그린플럼에서 시작됐으며 오픈소스로 구현해 클라우드베리 데이터베이스 상용제품을 선보였다”며 “이 프로젝트에 다수의 개발자가 참여하고 있다”고 설명했다.
씬스DB는 데이터 처리·분석·AI 워크로드를 하나의 오픈소스 환경에서 통합할 수 있다. 포스트그레스 기반 SQL 엔진에 고성능 병렬 처리와 머신러닝 오케스트레이션을 결합해 확장도 가능하다.
적용 분야는 제조·통신·금융 등으로 넓다. 제조업에선 불량률 분석과 수율 개선, 통신사에선 실시간 분석, 금융권에선 사기·리스크 탐지 사례가 예상된다. 의료·유통 영역에서도 데이터 처리 수요가 크다.
국내 시장 특성도 고려했다. 미국 등은 퍼블릭 클라우드 중심으로 성장했지만, 한국은 온프레미스 수요가 여전히 크다.
박 지사장은 “프라이빗 환경을 우선 공략하겠다”며 하드웨어 벤더, 시스템통합사(SI)와 협력을 확대할 계획이다. 한국 파트너로는 바이텍씨스템이 거론된다.
시장 전망은 긍정적이다. IDC에 따르면 국내 클라우드 IT 인프라 시장은 2023년 2조7000억원에서 2027년 3조8000억원으로 확대될 전망이다. 이 가운데 절반가량이 프라이빗 클라우드 수요다.
박 지사장은 “한국은 글로벌에서 데이터 분석 수요가 가장 강한 시장 중 하나”라며 “온프레미스·오픈소스·AI 분석 수요가 맞물리면서 성장 기회가 크다”고 했다.
업계에는 그린플럼 공백을 노린 오픈소스 업체들의 경쟁이 본격화할 것으로 본다. 다만 기존 시스템 전환 비용, 보안·규제 문제, 레퍼런스 확보 속도 등이 변수로 꼽힌다.