喜马拉雅亮相2023云栖大会展示创造性的"变声"能力引关注 具体是什么情况?

【喜马拉雅亮相2023云栖大会,展示创造性的"变声"能力引关注】具体的是什么情况呢,跟随小编一起来看看!
1、近日,2023云栖大会在杭州盛大开幕,超过200家云计算产业生态企业参展,喜马拉雅携最新自研语音技术成果亮相展会,并现场展示了AIGC与文娱音频产业深度融合的最新成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统。
2、AI技术的逐渐成熟为各行各业创新发展提供了全新动能,作为音频行业的领军企业,喜马拉雅率先开启AI与音频融合之路。喜马拉雅珠峰语音生成式大模型是喜马拉雅的创新性技术之一,具备快速实现语音音色和风格定制的能力。在这一技术支持下,创作者们可在不同的场景中实现音色实时转换,用创造性“变声”能力赋予作品多元化展示形式,宛如给声音涂上不同的“画皮”,有效提升了听众体验。此前,喜马拉雅珠峰实验室团队已通过AIGC方式创作了超过3.7万部有声书专辑,而AIGC作品的每日播放时长已超过250万小时。
3、据了解,珠峰语音生成式大模型由喜马拉雅珠峰智人团队与西北工业大学aslp lab共同合作完成,双方基于自研框架,实现音频与文本在统一框架下的稠密训练,用于语音生成任务,能够实现语音风格和音色的 zero shot 的学习和迁移,实现风格和音色的任意组合。同时,喜马拉雅基于阿里云数据湖3.0构建的云原生大数据平台,也成为喜马拉雅语音大模型不可或缺的“数据引擎”,为其提供了高质量数据支撑。
4、2023云栖大会现场,喜马拉雅展示了珠峰语音生成式大模型,吸引了大量众多参展来宾,其中不少是喜马拉雅的忠实用户,展台周边热闹非凡。
5、据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模型目前已经取得了显著的突破,在音色定制方面实现了5秒内的‘极速克隆’声音。通过极少量的数据,该模型能够克隆出具有90%相似度的基本音色,并在短短的10秒内快速生成定制音频。未来,这项技术在短视频创作、数字人配音、人机交互对话、名人IP复刻等领域有望发挥出巨大的潜在价值,有效解决商业场景中的沟通需求痛点。”
6、喜马拉雅珠峰实验室资深产品专家吕睿韬现场介绍到:“该语音大模型采用基于语音向量和语义标记的新型语音编解码器,其中语音向量包含用于高保真语音重建的声学细节,而语义标记(LLM)则侧重于语言建模的语音的语言内容,最终实现高效生成最富有语言表现力和最高保真度的语音(对话)内容。应用场景上,该语音大模型可应用于语音内容生成、口语对话、语音音色实时转换、说话风格迁移、语音到语音跨语种翻译、说话人匿名化等各种任务。”
7、同时,喜马拉雅还将在云栖大会上展示其第二代智能语音交互系统等新技术,加深了用户对于喜马拉雅这个平台的印象。未来,喜马拉雅将不断探索新科技,降低创作门槛,助力创作者高效生产内容,为用户提供更好的使用体验,为未来的科技与文化交融点缀一抹亮丽的音符。
以上就是关于【喜马拉雅亮相2023云栖大会,展示创造性的"变声"能力引关注 具体是什么情况?】相关内容!
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【浪漫主义诗人有哪些】浪漫主义是18世纪末至19世纪中叶在欧洲兴起的一种文学思潮,强调情感、自然、个人体验...浏览全文>>
-
【螃蟹要蒸多长时间才能蒸熟冷水还是热水】在日常生活中,蒸螃蟹是一道非常受欢迎的美食。但很多人对蒸螃蟹的...浏览全文>>
-
【家庭自制凉粉的做法】凉粉是一道清爽可口、制作简单的传统小吃,尤其适合夏天食用。在家自制凉粉不仅卫生、...浏览全文>>
-
【儿童玩具哪个牌子好】在选择儿童玩具时,家长往往最关心的是安全性、教育性以及趣味性。市面上的儿童玩具品...浏览全文>>
-
【加盟创业哪些项目好】在当前经济环境下,越来越多的人选择通过加盟的方式进行创业。这种方式具有品牌支持、...浏览全文>>
-
【时间是让人猝不及防的东西歌词】《时间是让人猝不及防的东西》是一首由张靓颖演唱的歌曲,歌词表达了对时间...浏览全文>>
-
【鬼吹灯王胖子叫什么】在《鬼吹灯》系列小说中,王胖子是一个极具特色的人物,他不仅是主角胡八一的搭档,也...浏览全文>>
-
【服从专业调剂啥意思】在高考志愿填报过程中,“服从专业调剂”是一个常见且重要的概念。很多考生和家长对此...浏览全文>>
-
【吃完螃蟹可以吃柿子吗】很多人在吃海鲜时,会担心食物之间的搭配是否安全。尤其是螃蟹和柿子,这两种食物都...浏览全文>>
-
【为什么海陆热力性质会小】在地理和气候学中,我们经常提到“海陆热力性质差异”这一概念。然而,有时我们会...浏览全文>>
