关注我们
QRcode 邮件联系 新浪微博
首页 > 科技 » 正文

讯飞星火多情感超拟人合成首次发布 全自然语音交互再上新台阶

 小尚

说起语音合成技术,你会想到什么场景应用?很多人小时候玩过的“录音娃娃”,其实就是语音合成技术的初级类型,而火遍全网的“会说话的汤姆猫”,通过可爱卡通形象学你说话,也让语音合成技术上升到有趣的层面。但站在行业的视角,能否让语音合成技术拥有更深刻的场景应用?4月26日,讯飞星火V3.5春季上新交出了一份高水平答卷。

“讯飞星火”是科大讯飞旗下通用大模型,也是国内首个全国产算力训练的大模型。此次讯飞星火V3.5新版一口气带来了长文本、长图文与长语音三大能力升级,并且语音大模型也全新升级,带来了“多情感超拟人合成”与“一句话声音复刻”两大功能。

如何让语音合成由“千篇一律”进化到“千人千面”?这需要强大的技术储备做支撑。在语音合成领域,Blizzard Challenge是极具影响力的国际赛事,科大讯飞自2006年参赛夺冠以来,就开启了连续14年的冠军之路。这次讯飞星火V3.5新版首发的多情感超拟人合成功能,将全自然语音交互体验带上了新的台阶。

根据发布会上讯飞研究院院长刘聪的演示,这项功能让人机对话变得不再生硬和冰冷,AI女声被赋予撒娇、安慰等拟人化的情感表达,同时传递出困惑、高兴、难过等外化情绪。当刘聪告知“五一”要看演唱会后,AI充满感情地回答道“我都能够想到你在现场欢呼的样子,哈哈,我好羡慕啊”,像是朋友间的一场对话,陪着你一起高兴。

本文标签:
余华首次单人直播获682万人次观看 《许三观卖血记》抖音电商热卖
英特尔:竞争让所有人变得更好 让中国电动车市场变得如此强大