섹션

LG, 초거대 멀티모달 AI '엑사원 2.0' 공개

LG AI연구원이 19일 강서구 LG사이언스파크에서 ‘LG AI 토크 콘서트 2023’을 열고 초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’을 공개했다.

이번에 공개한 ‘엑사원 2.0’은 특허, 논문 등 약 4,500만 건의 전문 문헌과 3억 5천만 장의 이미지를 보유하고 있으며, 지속적으로 데이터 학습을 진행되고 있다.

LG AI연구원은 ‘엑사원 2.0’을 한국어와 영어를 동시에 이해하고 사용하는 이중 언어(Bilingual) 모델로 개발했으며 학습 데이터의 양도 기존보다 4배 이상 늘려 성능을 높였다고 전했다.

또, 초거대 AI의 고비용 이슈를 해결하기 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화, 최적화 신기술 개발이 이루어졌다.

그 결과 ‘엑사원 2.0’의 언어 모델은 추론(Inference) 처리 시간이 25% 단축되었고, 메모리 사용량은 70% 줄여 78%의 비용 절감효과를 얻은 것으로 알려졌다.

LG AI Talk Concert 2023 Teaser의 EXAONE 소개 이미지
LG AI Talk Concert 2023 Teaser의 엑사원 2.0 소개 이미지 [LG AI연구원 제공]

LG AI연구원은 고객들이 ‘엑사원 2.0’을 원하는 용도나 예산에 맞게 모델의 크기부터 사용 언어 등의 종류까지 맞춤형으로 설계할 수 있다고 설명했다.

한편 ‘엑사원 2.0’은 고객 데이터 보안을 위해 학습 과정을 미세 조정하는 파인 튜닝(Fine-Tuning)과, AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형(On-Premise) 및 사설 클라우드(Private Cloud) 방식도 지원한다.

LG AI연구원은 대표적인 엑사원 활용 사례로 LG전자의 AICC(AI Contact Center, AI 컨택 센터)를 소개했다.

AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안하는 AI다.

LG AI연구원은 현재 국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 예정이라고 밝혔다.

이날 ‘LG AI 토크 콘서트 2023’에서는 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)를 차례로 공개했다.

엑사원 2.0의 3대 플랫폼
엑사원 2.0의 3대 플랫폼 [LG AI연구원 제공]

먼저 엑사원 유니버스는 ▲질의응답·대화 ▲텍스트 분류·요약 ▲키워드 추출·생성 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈했다.

LG AI연구원은 엑사원 유니버스를 각 분야의 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다고 설명했다.

엑사원 유니버스는 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다.

또, 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.

LG AI연구원은 이날 시연한 엑사원 유니버스의 AI/머신러닝 분야 서비스를 7월 31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 시작한다.

이어 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다.

다음으로 엑사원 디스커버리는 세상에 없던 새로운 지식을 발견하는 플랫폼으로 가장 먼저 신소재·신물질·신약 관련 탐색에 적용하고 있다.

LG AI연구원은 ‘엑사원 디스커버리’에 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등의 정보까지 AI가 읽고 학습할 수 있도록 하는 심층 문서 이해(DDU) 기술이 적용되었다고 밝혔다.

이를 통해 1만 회가 넘었던 신소재의 합성 시행착오를 수십 회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축할 수 있을 것으로 예상된다.

LG AI연구원은 올해 4분기에 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 엑사원 디스커버리 서비스를 제공할 예정이다.

엑사원 디스커버리의 이해 및 설계 프로세스
엑사원 디스커버리의 이해 및 설계 프로세스 [LG AI연구원 제공]

이어 ‘엑사원 아틀리에’는 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼이다.

엑사원 아틀리에는 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어(Pair) 데이터 3.5억 장을 학습한 ‘엑사원 2.0’을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다.

LG AI연구원은 인간과 AI가 상호작용을 통해 디자인을 완성해가는 ‘디자인 싱킹 프로세스(Design Thinking Process)’를 엑사원 아틀리에에 접목하기 위해 미국 파슨스 디자인 스쿨과 공동 연구개발을 이어가고 있다고 설명했다.

지난 6월에는 셔터스톡(Shutterstock)과 함께 상용화한 ‘캡셔닝 AI’ 기능도 엑사원 아틀리에에 탑재됐다.

캡셔닝 AI란 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성하는 AI다.

배경훈 LG AI연구원장은 이날 행사에서 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”라고 전했다.

이어 “국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 ’다른 생성형 AI들과는 차별화된 고객 가치’를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것”이라는 포부를 밝혔다.