국내 AI 스타트업 아이젠사이언스가 최근 고려대학교, 임페리얼 칼리지 런던(ICL)과 공동으로 연구 개발한 ‘Meerkat-7B’가 업계 최초로 미국 의사면허시험 ‘USMLE’를 통과했다고 9일 밝혔다.
Meerkat-7B는 의료 분야에 특화된 sLLM(소형언어모델)으로, 사용 분야를 한정한 대신 계산 속도와 성능이 뛰어나다는 장점이 있다.
기존에도 챗GPT를 만든 오픈AI나 구글 등 빅테크들이 고성능 LLM을 출시했으나, 외부 클라우드를 이용하기에 민감한 데이터를 다루는 기관에서는 데이터 유출의 위험이 있었다.
이에 최근에는 기관 내부에서만 AI가 작동되어 보안성을 높인 sLLM의 수요가 증가하고 있다.
sLLM은 외부 클라우드 없이도 동작할 수 있도록 모델의 매개변수를 줄여 비용을 낮추고, 미세조정 과정을 거쳐 정확도가 높다.
예를 들어 GPT-3.5의 매개변수는 1750억 개이고, 구글의 PaLM은 5400억 개의 매개변수를 가지고 있으나 Meerkat-7B는 매개변수를 70억 개로 제한했다.
이는 PC에서도 AI를 설치 및 활용할 수 있는 크기이기에 비교적 크기가 작은 중소병원이나 의료시설에서도 사용이 가능하다.
아울러 아이젠사이언스는 비교적 적은 매개변수로도 선택과 집중을 통해 성능을 높였다.
기존의 최고 sLLM으로 불리는 MediTron-7B는 60점이 평균 합격점인 미국 의사면허시험에서 52점을 기록하며 시험에 떨어졌으나, Meerkat-7B는 74점을 받으며 최초로 시험에 합격한 sLLM이 되었다.
또 7개의 의료 벤치마크 성능평가에서 GPT-3.5 모델보다 평균 13% 높은 성능을 보인 바 있다.
아이젠사이언스는 의생명 특화 언어모델을 통해 병원 내에서 임상 의사 결정을 지원하거나 비표준화된 의료 차트의 정리와 같은 의료·행정의 효율성을 높일 수 있을 것으로 기대했다.
아이젠사이언스 강재우 대표는 “의생명 분야에서는 매일 3000편 이상의 연구 논문이 발표되는데, 이렇게 방대한 정보 속에서 신약 개발에 필요한 새로운 질병 표적 단백질을 식별하고 검증하는 작업은 매우 시간이 소모되는 일”이라고 말했다.
이어 “Meerkat-7B는 새로운 약물 타깃을 발굴하는 과정을 혁신적으로 단축할 수 있으며, 이번 성과를 바탕으로 의료 특화 LLM을 활용한 신규 사업모델 또한 준비 중”이라고 덧붙였다.