한컴은 PDF 오픈소스로 데이터 병목 해소

이미지 = 엔비디아, 인텔
이미지 = 엔비디아, 인텔

[시사저널e=송주영 기자] 인텔과 엔비디아가 NV링크를 매개로 데이터센터용 맞춤형 x86 CPU와 CPU-GPU 통합형 x86 RTX SoC를 공동 개발키로 했다. 하드웨어 생태계 재편을 선언했다.

한글과컴퓨터는 학습용 데이터 확보의 병목으로 꼽혀온 PDF 추출 기술을 글로벌 오픈소스로 공개했다. 이번 ‘오픈데이터로더 PDF’는 텍스트·표·이미지·레이아웃을 정형 데이터로 변환하는 기능에 보안 위협 차단 장치까지 더했다

◇ 인텔-엔비디아, AI 인프라·PC용 공동개발 협력

인텔과 엔비디아는 19일 맞춤형 데이터센터와 PC 제품을 공동 개발키로 했다. 양사는 엔비디아 NV링크(NVLink)를 활용해 양사의 아키텍처를 연결하는 데 주력하며 이를 통해 엔비디아의 AI 및 가속 컴퓨팅 역량과 인텔의 CPU 기술 및 x86 생태계를 결합할 계획이다.

데이터센터 부문에서 인텔은 엔비디아 맞춤형 x86 CPU를 제작하고 엔비디아는 이를 AI 인프라 플랫폼에 통합해 시장에 공급할 예정이다.

개인용 컴퓨팅(PC) 분야에서 인텔은 엔비디아 RTX GPU 칩렛을 통합한 x86 시스템 온 칩(SOC)을 제작해 시장에 공급할 계획이다. 새 x86 RTX SOC는 CPU와 GPU 통합을 요구하는 다양한 PC에 탑재될 예정이다.

엔비디아는 인텔 보통주에 주당 23.28달러의 매입가로 50억달러를 투자키로 했다. 이번 투자는 규제 당국의 승인 등이 완료되면 진행키로 했다.

젠슨 황 엔비디아 CEO는 “이번 협력은 두 개의 세계적 플랫폼의 융합으로, 엔비디아의 AI 및 가속 컴퓨팅 스택과 인텔의 CPU, 방대한 x86 생태계를 긴밀히 결합할 것”이라며 “양사는 생태계를 확장하고 차세대 컴퓨팅 시대의 기반을 마련할 것”이라고 밝혔다.

립부 탄 인텔 CEO는 “데이터센터 및 클라이언트 컴퓨팅 플랫폼은 공정 기술, 제조 역량, 첨단 패키징 기술과 결합돼 엔비디아의 AI 및 가속 컴퓨팅 리더십을 보완할 것”이라며 “젠슨황 CEO와 엔비디아 팀이 투자로 보여준 신뢰에 감사하며 고객을 위한 혁신과 사업 성장을 위해 함께할 앞날을 기대한다."고 말했다.

◇ 한컴, PDF 추출 기술 글로벌 오픈소스로 공개

한글과컴퓨터(이하 한컴)가 AI 학습 및 활용 과정에서 고질적인 난제로 지적돼 온 PDF 문서 데이터 처리 병목 현상을 해소할 핵심 기술을 글로벌 오픈소스로 전격 공개했다. 이번에 공개된 ‘오픈데이터로더 PDF(OpenDataLoader PDF)’는 한컴이 오랜 기간 축적한 문서 처리 기술력을 바탕으로 개발한 PDF 데이터 추출 엔진으로 글로벌 AI 생태계 확산을 위한 기술적 기반을 마련했다.

이번 오픈소스 프로젝트는 학습용 데이터 추출이 어려운 PDF 문제를 해결하기 위해 한컴이 지난 7월 PDF 기술 전문 기업 듀얼랩과 체결한 업무협약의 첫 결실이다. 양사는 오픈소스 기반 PDF 데이터로더를 공동 개발하며 AI 생태계 확장을 목표로 하고 있으며 이번 기술 공개를 통해 본격적인 확산에 나섰다.

공동 개발한 오픈데이터로더 PDF는 PDF 문서 내 텍스트, 표, 이미지, 레이아웃 정보를 추출해, AI 학습에 즉시 활용할 수 있는 정형화된 데이터(JSON, Markdown, HTML)로 변환한다.

아울러 오픈데이터로더 PDF는 악의적인 콘텐츠 삽입을 통한 프롬프트 인젝션(Prompt Injection) 등 보안 위협을 자동 감지·차단하는 기능을 추가로 제공할 예정이ek. 이를 통해 AI 학습 데이터의 안정성과 신뢰성을 동시에 보장한다.

정지환 한컴 최고기술책임자(CTO)는 “AI 트랜스포메이션(AX) 시대, 오픈소스는 더 이상 선택이 아닌 기업과 사회 전반의 혁신과 경쟁력 확보를 위한 필수 전략”이라며 “연말에는 AI 기반 문서 인식 기술을 추가하는 등 오픈소스 프로젝트를 지속적으로 고도화하겠다”고 밝혔다.

◇ 이안, 온프레미스 기반 AI 코딩 챗봇 ‘코드메이트’ 출시

산업용 디지털 트윈 솔루션 전문기업 이안은 온프레미스 환경에서 독립적으로 구동 가능한 AI 코딩 챗봇 ‘코드메이트’를 출시했다고 19일 밝혔다.

이번에 출시된 코드메이트는 PC 및 GPU 환경에서 구동되는 경량 코딩 LLM 기반 소프트웨어다. 사내 인트라넷이나 폐쇄망에서 인터넷 연결 없이 사용 가능한 구조로 설계됐다. 보안이 핵심인 공공기관·금융·국방·의료 산업 등에서도 안전하게 활용 가능하다.

또 타사 API 사용이나 외부 서비스 중단, 과금 이슈에서 자유롭다. 온프레미스 기반 운영으로 소스코드, 프로젝트 자료, 기밀 정보의 외부 유출 위험을 원천 차단하고, 산업별 보안 규정을 준수할 수 있는 환경을 제공한다.

특히 로컬 GPU 가속을 활용한 실시간 응답이 가능하고 대규모 모델 대비 50~80% 빠른 추론 속도를 구현한다. 저사양 PC에도 구동이 가능해 추가 인프라 투자 없이도 도입이 가능하다. 코드메이트는 프로젝트 특성에 따라 파이썬 전문 모델, C++ 최적화 모델 등으로 전환할 수 있으며 사내 코드베이스를 기반으로 학습한 커스텀 모델을 적용할 수 있다. 최신 오픈소스 LLM이 공개될 경우 즉시 교체가 가능해 기술 선점 경쟁력도 확보할 수 있다.

개발자는 자연어 요청만으로 코드 생성과 디버깅을 수행할 수 있으며 멀티파일을 동시에 분석해 프로젝트 전반에 걸친 정확한 솔루션을 제시한다. 예를 들어 “이 코드에서 메모리 누수 원인을 찾아줘”와 같은 요청에도 즉시 응답한다.

저작권자 © 시사저널e 무단전재 및 재배포 금지