当您想到诸如Amazon的Alexa和Apple的Siri之类的语音助手时,可能不会想到“情感”和“富有表现力”两个词。取而代之的是,可以识别出平整而礼貌的声音,没有任何影响-对助手来说很好,但是如果您想在游戏,电影和其他讲故事的媒体中使用合成声音,则该声音将无法正常工作。

这就是为什么一家名为Sonantic的初创公司试图创建能够令人信服地哭泣并传达“深厚的人类情感”的AI 的原因stylechina.com。这家总部位于英国的初创公司上个月宣布,它已经筹集了230万欧元的资金,由EQT Ventures牵头,今天,它发布了一段视频,展示了其技术的能力。
您可以在下面的视频中自行判断结果;声纳说所有的声音都是由它的技术创造的。就个人而言,我不确定我会说这些表演与一位才华横溢的人声演员是可以互换的,但它们肯定比我以前听过的任何合成唱片都给人留下深刻的印象。
Sonantic的实际产品是音频编辑器,已经在游戏制造商的测试中。该编辑器包括各种不同的语音模型,联合创始人兼首席执行官Zeena Qureshi表示,这些模型是基于实际的语音演员并与他们一起开发的,然后可以分享利润。
库雷希说:“我们深入研究了声音的细节和呼吸的细微差别。” “声音本身需要讲一个故事。”
联合创始人兼首席技术官John Flynn补充说,游戏工作室是一个明显的起点,因为它们通常需要记录数以万计的对话。他说,这可以使他们更快地进行迭代,以针对不同的游戏环境(例如,当角色正在奔跑并且听起来像他们喘不过气来)改变声音,并避免当角色应该这样做时的声音紧张诸如哭泣或喊叫之类的事情。
同时,弗林来自电影后期制作领域,他建议这项技术适用于游戏以外的许多行业。目标不是取代演员,而是探索新型的讲故事机会。
他说:“看看有多少CGI技术支持真人电影。” “这不是非此即彼。一项新技术可让您以奇妙的方式讲新故事。”
Sonantic还使我与阿拉贝拉·戴(Arabella Day)联系,后者是帮助开发初始语音模型的演员之一。Day记得花了几个小时记录不同的线路,然后终于接到Flynn的电话,Flynn继续播放她自己的声音的合成版本。
“我对他说,'是我吗?我记录了吗?她回忆道。
她将与Sonantic的工作描述为“一种真正的合作伙伴关系”,在其中她提供了新的录音和反馈意见,以不断改进该模型(显然,她的最新工作涉及美国口音)。她说,公司希望她对自己的声音使用方式感到满意,甚至问她是否有她想列入黑名单的公司。
戴说:“作为一名演员,我根本不认为演艺的未来就是人工智能。” “我希望这是我正在做的事情的一部分,这是我拥有的额外优势。”
同时,她说,在许多领域,人们对AI替代人类工人存在“合法”关注。
她说:“如果它将成为娱乐的未来,我想成为其中的一部分。” “但是我想成为它的一部分并与之合作。”