섹션

네이버클라우드, '클로바 스피치' 실시간 스트리밍 기능 추가

네이버클라우드가 음성을 텍스트로 변환하는 기업용 서비스 '클로바 스피치'에 실시간 방송의 음성도 자막으로 변환하는 '실시간 스트리밍' 기능을 추가했다고 2일 밝혔다.

클로바 스피치는 AI 기반 STT(음성·텍스트 변환) 서비스로, 현재 네이버 뉴스의 자동 자막 생성 기능, 네이버 쇼핑라이브, 고객센터 통화 데이터 관리 등에 적용되고 있다.

새로 추가된 실시간 스트리밍 기능은 고정된 영상에서 자막을 추출하는 기존 방식과 달리 실시간 환경에서도 즉각 화자의 목소리를 텍스트로 만들어내는 기술이다.

현재 한국어, 영어, 일본어 3개 국어를 지원하며, 음성의 어절 단위로 텍스트가 형성된다.

기존 실시간 생방송 자막에는 보통 속기사의 타이핑 작업을 통해 만들어냈지만, 이제 AI를 통해 자막이 자동으로 달리게 설정할 수 있다.

네이버 클라우드의 '클로바 스피치' 구조 [네이버 클라우드 제공]
네이버 클라우드의 '클로바 스피치' 구조 [네이버 클라우드 제공]

네이버클라우드는 해당 기술을 고객센터에도 적용해 통화 내용을 즉각 텍스트화하고 모니터링함으로써 고객 대응 속도를 높일 예정이다.

네이버클라우드는 관계자는 “이번 실시간 스트리밍 서비스 출시에 맞춰 음성인식과 화자인식 서비스 이용 요금을 이전보다 40% 낮추고 단일 요금제 대신 기능별로 요금을 세분화할 것”이라고 밝혔다.

또 “현재 영어 발음의 정확도를 판단해주는 기능도 선택 옵션으로 존재하며, 향후 더 다양한 언어 확충과 해석 정확성 향상을 지속할 것”이라고 덧붙였다.