公司里其他的项目提上了日程。
语音合成软件终于彻底开发完毕,这天,唐小玉和谷涵带着项目成品来找他汇报。
两人分别输入了几段对话和书面语旁白,系统用不同的声音念出来,从萝莉到大叔每个音色都十分逼真,尤其是对话,就如普通聊天一样自然。
“这个自然度很好,”楼清焰首先肯定,“从外部完全听不出是假的?”
“完全听不出来,已经做过无数次测验了,”唐小玉说,“最后甚至连系统bug都找不到了。”
“不过那只是听不出来而已,”谷涵补充,“我们一开始也设想过完全拟真,最后发现是不可能的,不管语音听起来再怎么逼真,总能从波形或者程序里找到端倪。比如说,老大你看这个。”
他打开刚才某段语音的波形,指着两处相隔甚远的片段,说:“比如这两处,折线完全重合。它们表示两个语调、音量、音色一模一样的字。这两个字可能处在不同的语境中。”
“这种情况会经常发生,当AI认为某个片段很适合插在这里,就自然而然塞进来了。事实也表明,同样的字出现在不同的语境里,毫无违和。”
“但我们人类不会这样,不可能在不同时刻说出两个波形完