(서울=NSP통신) 이복현 기자 = 크래프톤(259960)이 AI 모델 브랜드 ‘Raon’을 출범하고 ▲음성 지원 대규모 언어 모델 ▲실시간 음성 대화 모델 ▲텍스트-음성 변환 모델 ▲비전 인코더 등 4종을 허깅페이스에 오픈소스로 공개했다.
Raon은 순우리말 ‘라온’에서 착안한 이름으로, AI 기술을 통해 게임의 본질적 즐거움을 만들겠다는 크래프톤의 철학을 담았다. 회사는 이번 공개를 통해 데이터 수집부터 학습, 성능 평가까지 파운데이션 모델 개발 전 과정을 자체 수행할 수 있는 역량을 제시했다.
이번에 공개한 모델은 Raon-Speech, Raon-SpeechChat, Raon-OpenTTS, Raon-VisionEncoder다. 크래프톤은 이를 통해 음성과 시각 정보를 아우르는 멀티모달 AI 기술 경쟁력을 강화한다는 방침이다.
Raon-Speech는 90억 파라미터 규모의 음성 언어 모델로, 10B 이하 공개 음성 언어 모델 가운데 영어와 한국어 모두에서 글로벌 1위 성능을 기록했다.
Raon-SpeechChat은 실시간 양방향 통신 기술을 적용한 음성 모델로, 국내에서 발표된 실시간 풀듀플렉스 음성 모델이다.
Raon-OpenTTS는 공개 음성 데이터 기반의 텍스트-음성 변환 모델이며, Raon-VisionEncoder는 사전 학습 모델 없이 처음부터 자체 학습한 비전 인코더다.
크래프톤은 앞으로 Raon을 중심으로 AI 모델과 에이전트 기술 고도화를 이어갈 계획이다.
NSP통신 이복현 기자(bhlee2016@nspna.com)
ⓒ한국의 경제뉴스통신사 NSP통신·NSP TV. 무단전재-재배포 금지.