중국의 전자상거래 선두주자인 알리바바는 26일(현지 시각) 비디오 및 이미지 생성 인공지능 모델인 Wan 2.1이 오픈소스로 공개됐다고 밝혔다.
로이터 통신에 따르면 알리바바의 이번 발표는 올해 초 표면적으로 저가형 오픈소스 모델을 출시한 스타트업 딥시크의 비슷한 조치에 따른 것이다.
딥시크는 오픈AI와 같은 기존 경쟁사와 비슷한 성과를 거두며 기술 투자자들 사이에서 흥분과 놀라움을 불러일으켰다.

알리바바는 텍스트와 이미지 입력에서 이미지와 동영상을 생성하는 Wan 2.1의 네 가지 변형인 T2V-1.3B, T2V-14B, I2V-14B-720P, I2V-14B-480P를 출시했다고 밝혔다.
'14B'는 이 변형이 140억 개의 매개변수를 수용한다는 것을 나타내며, 이는 훨씬 더 많은 입력을 처리하여 더 정확한 결과를 얻을 수 있음을 의미한다.
이 모델은 전 세계적으로 알리바바 클라우드의 모델스코프(ModelScope) 및 허깅페이스 플랫폼에서 학술, 연구 및 상업용으로 제공된다.
알리바바는 1월에 비디오 및 이미지 생성 AI 모델의 최신 버전을 출시했으며, 나중에 Wanx에서 Wan으로 이름을 단축하여 매우 사실적인 비주얼을 생성할 수 있는 능력을 자랑했다.
이후 비디오 생성 모델의 리더보드인 V벤치에서 멀티 오브젝트 상호작용과 같은 기능 분야에서 최고 순위를 차지했다.
25일 알리바바는 전체 출시 시 오픈 소스로 공개할 예정인 추론 모델 QwQ-Max의 미리보기를 공개했다.
또한 이번 주에는 클라우드 컴퓨팅 및 AI 인프라를 강화하기 위해 향후 3년간 최소 3,800억 위안(520억 달러)을 투자할 계획이라고 발표했다.