국내 AI 스타트업 업스테이지가 자체 개발한 거대언어모델(LLM) '솔라'(Solar)를 14일 공개했다.
거대언어모델이란 방대한 데이터를 통해 딥러닝을 진행한 사전 학습 AI로, 사람이 사용하는 자연어 처리에 특화된 AI다.
업스테이지는 ‘솔라’의 강점으로 세계 최대 머신러닝 플랫폼 허깅페이스의 ‘오픈 LLM 리더보드’라는 평가 프로그램에서 74.2점을 받아 1위를 기록한 것을 꼽았다.
‘오픈 LLM 리더보드’는 크게 LLM의 추론·상식 능력·언어 이해 능력·환각(할루시네이션) 방지·대명사 참조·수학 해결 능력의 6가지 지표를 평가해 순위를 매긴다.
특히 컴퓨터의 버그와 같은 할루시네이션 현상은 AI가 문제와 전혀 다른 대답을 하거나 없는 사실을 만들어내는 문제로, LLM의 원활한 사용을 위해선 이러한 현상의 방지가 중요하다.
오픈 LLM 리더보드의 평가는 상시 개방 상태이며, 참가 기업이나 개인이 자체 LLM을 제출하면 평가 후 바로 리더 보드가 갱신되는 방식으로 진행된다.
14일 기준 현재도 허깅페이스의 리더보드에는 업스테이지의 ‘솔라’가 1위를 이어가고 있다.
한편 업스테이지는 ‘솔라’가 기업들이 활용하기 좋은 프라이빗 LLM을 위해 작은 크기로 구성된 경량형 언어모델(sLLM)이며, 파라미터 규모는 107억 개(10.7B) 수준이라고 밝혔다.
LLM은 경량·대규모에 따라 파라미터 규모에 차이가 발생하는데, 30억 개 수준의 초경량부터 많게는 2000억 개가 넘는 대규모 LLM도 존재한다.
업스테이지 관계자는 "‘솔라’는 알리바바의 최신 모델인 큐원(Qwen)의 6분의 1도 안 되는 크기로 이를 훌쩍 뛰어넘는 성능을 증명했다"라고 강조했다.
이어 "최근 20억 달러의 기업 가치로 유니콘에 오른 미스트랄AI의 최신 모델 '믹스트랄' 모델의 성능 지표마저 뛰어넘었다"라고 밝혔다.
향후 업스테이지는 아마존웹서비스(AWS) 등과의 협력을 통해 기술력을 바탕으로 글로벌 생성 AI 시장에 본격적으로 진출할 방침이다.