국내 AI 반도체 기업 퓨리오사 AI가 2세대 AI 추론 가속기 RNGD를 마이크로소프트 플랫폼 ‘애저 마켓플레이스’에 공식 출시했다고 17일 밝혔다.
이를 통해 고성능 AI 인프라 활용성을 높인다는 계획이다.
RNGD는 LLM 및 멀티모달 모델의 효율적인 추론을 위해 설계된 데이터 센터용 차세대 AI 가속기로, 지난해 8월 미국 ‘핫 칩스 2024’ 컨퍼런스에서 첫선을 보였다.
특징으로는 클라우드 중심, 온프레미스, 하이브리드 등 다양한 환경에 최적화되어 있다는 점이 꼽힌다.
![퓨리오사AI의 MS 애저 마켓플레이스 진출 [퓨리오사AI 제공] 퓨리오사AI의 MS 애저 마켓플레이스 진출 [퓨리오사AI 제공]](https://images.jkn.co.kr/data/images/full/978677/ai-ms-ai.jpg?w=600)
퓨리오사AI의 MS 애저 마켓플레이스 진출 [퓨리오사AI 제공]
퓨리오사AI는 RNGD가 추론용 프로덕션 환경 배포, 수요에 따른 추론 인프라 규모 조절, 기존 소프트웨어 스택과의 원활한 통합 등을 지원할 것으로 기대했다.
향후 퓨리오사 AI는 MS의 ‘라마 3.1’ 사전 컴파일 모델을 기반으로 API를 제공한다.
이를 통해 기업 고객은 AI 추론 성능을 즉시 테스트하고 활용이 가능해진다.
MS 제이크 즈보로프스키 총괄은 “애저 마켓플레이스는 신뢰할 수 있는 파트너 솔루션을 쉽게 찾고 배포할 수 있도록 협력 관계를 늘려 나갈 것”이라고 말했다.
퓨리오사 AI 관계자는 “레니게이드의 애저 통합은 누구나 접근 가능한 효율적인 AI 추론 인프라를 제공하게 될 것이다”라는 포부를 밝혔다.