本报讯 (记者李乔宇)
8月11日,昆仑万维科技股份有限公司(以下简称“昆仑万维”)SkyWorkAI技术发布周正式启动。8月11日至8月15日,公司每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。
截至目前,昆仑万维已经发布SkyReels-A3、Matrix-Game2.0、Matrix-3D、SkyworkUniPic2.0、SkyworkDeepResearchAgent模型。8月15日,昆仑万维正式上线MurekaV7.5模型。至此,昆仑万维SkyWorkAI技术发布周完美收官。
MurekaV7.5在中文歌曲上的演绎再上新台阶,不仅实现了中文歌曲音色、演奏技法的大幅提升,还完成了中文歌曲咬字与情感表现提升。
首先,基于对中文曲风和元素的强大理解,Mureka的理解模型对传统民歌、戏曲到经典华语流行金曲乃至当代民谣音乐拥有深刻认知。这种在中文音乐多样性与文化特性上的深度积累,使模型在理解和生成中文音乐时,能够更准确地传达其特有的艺术神韵和情感色彩。
其次,为了进一步提升生成音乐中人声表现的真实性与情感深度,昆仑万维针对歌曲特点优化了ASR技术,使之成为理解模块的有力延伸。这项技术深入到演唱的微观层面,不仅精准识别唱词,更能通过分析真实演唱中的气息运用、情感起伏和唱法细节,智能划分出符合演唱规律的乐句,并确定自然的换气与停顿位置。结合同样精准的乐段识别,显著提升了生成人声的段落清晰度与结构真实感。
同时,在语音模型方向上,昆仑万维语音团队推出MoE-TTS——首个基于MOE的角色描述语音合成框架。
MoE-TTS创新性地结合预训练大语言模型(LLM)文本能力与语音专家模块(SpeechExpertModules),为文本与语音分别配置专用专家模块,并在Transformer核心结构中引入模态路由,确保各模态独立优化、互不干扰。
(编辑 张明富)