국내 AI 전문기업 업스테이지가 지난 17일 대규모 언어 모델(LLM)이 빠르고 정확하게 문서를 분석할 수 있도록 하는 차세대 광학문자인식(OCR) 모델 ‘도큐먼트 파스’를 출시했다고 18일 밝혔다.
기존에도 LLM 학습 효율 향상을 위한 OCR 모델이 존재했지만, 여러 열의 레이아웃이나 복잡한 형태의 문서는 명확하게 인식하지 못한다는 문제점이 있었다.
이에 업스테이지는 문서의 구조와 텍스트 정보를 함께 분석하면서 데이터화하는 새로운 OCR 모델을 개발했다.
도큐먼드 파스는 어떤 형식의 문서라도 HTML과 같이 구조화된 텍스트 형식으로 전환할 수 있으며, 기업이나 기관에 최적화된 것으로 알려졌다.
업스테이지는 이를 통해 검색 증강 생성(RAG) 시스템 성능을 높일 뿐만 아니라 LLM의 응답 정확도도 높아질 것으로 기대했다.
![업스테이지가 개발한 광학문자인식 모델 '도큐먼트 파스' [업스테이지 제공] 업스테이지가 개발한 광학문자인식 모델 '도큐먼트 파스' [업스테이지 제공]](https://images.jkn.co.kr/data/images/full/975410/image.jpg?w=560)
특히 속도와 사용성 측면에서 도큐먼트 파스가 가장 진보한 형태의 문서 처리 기술이라는 설명이다.
아울러 문서 구조 분석 벤치마크인 ‘DP-Bench’ 테스트에서도 도큐먼트 파스는 모든 지표에서 아마존 웹 서비스(AWS)와 마이크로소프트(MS) 등 빅테크 서비스보다 5% 이상 높은 점수를 받은 것으로 알려졌다.
일례로 도큐먼트 파스는 문서 처리 속도에서 1분에 100장을 처리하는데, 이는 AWS의 10배 수준이며 오픈AI의 ‘라마파스’보다도 5배 더 빠르다.
업스테이지 김성훈 대표는 "도큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구"라고 강조했다.
이어 "앞으로 다양한 비즈니스에 신기술이 적용되면 실제적인 혁신을 체감할 수 있을 것"이라는 포부를 밝혔다.