“这是2014年11月,亚马逊推出的一款智能音箱echo。”
“截至目前,它的销量已达300万台。”
“它不用按钮和遥控器,里面有七个麦克风阵列,能捕捉7米范围左右的声音。我们对它发口令,它完成。
主要有三个功能:语音交互、智能家居控制、语音购物。
我们认为,这种智能音箱是下一个不大不小的流行产品,国内各厂可能很快就会跟进。因为它门槛相对较低,容易出货。”
说着,白永祥又拎出一个深蓝色的圆柱形音箱,上面有meizu的logo。
“这是我们的半成品,外观已经确定了,高21.16厘米,宽度和厚度均为8.8厘米,重636克。
它的顶部藏着6组高精度数字麦克风,可以360度收音,理论上,只要声音足够大且清晰,能让它捕捉到,它都可以响应。
我先给你们演示一下吧……”
白永祥揉揉鼻子,露出一抹不太自信的笑容,退后几步,唤道:“小溪!”
“我在!”
一个好像人声,又好像合成音的女性声音从音箱里传了出来,还算温柔动听。
“放首陈奕迅的《最佳损友》!”
“好的!”
紧跟着,一段旋律传出,音质保持了魅族做mp3起家的一贯水准,非常出色,唱道:“朋友,我当你一秒朋友;朋友,我当你一世朋友……”
“小溪!”
“我在!”
白永祥又唤了一声,音乐停止。
“童话故事《白雪公主》!”
“在很久很久以前,王国里有一位美丽的公主,她的头发像乌木一样漆黑,她的嘴唇像血一样红润,她的皮肤像雪一样白皙……”
“小溪!bj今天的天气!”
“bj今天晴,最高气温……”
呦呵!
连续蒙对了三个,白永祥信心暴涨,示意众人我要上强度了!
于是他又问:“小溪,伱饿了么?”
“……”
没动静。
“小溪,你吃饭了么?”
“我是你的智能语音助手,我会很多技能,我可以帮你查天气、定闹钟、算数、讲故事……”
白永祥抽了抽眼角,再道:“小溪,我说一句,你说一句。”
“好的,请开始吧!”
“伟大的拿破仑将抵达他忠诚的巴黎!”
“……”
没动静。
“我说一句,你说一句。”
“好的,请开始吧!”
“伟大的拿破仑将抵达他忠诚的巴黎!”
“……”
还是没动静。
“小溪,你不是开始么,你说啊!”
白永祥提高音量。
“好的,你想说什么呢?”
“小溪,我现在给你拆掉,你怕不怕?”
“你这个问题让我的声音蒙上了一丝阴霾。”
“你能不能尊重我一点?”
“人生如此艰难,为什么还要拆穿我呢?”
“小溪!”
“你想说什么呢?”
“哈哈哈哈!”
白永祥遭到了大家无情的嘲笑,于佳佳笑得拍大腿,道:“老白啊,你这是智能还是智障啊?”
“惨不忍睹!惨不忍睹!”
“完了完了,老白晚节不保!”
白永祥擦了擦汗,无奈道:“现在就是这么个情况,所以我告诉你们,不要有太大期望。下面请王斌博士给我们讲一讲。”
王斌站到台前,大屏幕亮起,显示小溪的研发历程。
他尽量通俗易懂。
“我们要进行语音交互,首先让小溪听懂,听懂之后还能回应,回应之后还能执行。
当用户呼叫‘小溪’时,系统能准确地识别出来,哪些是在叫它,哪些不是。
成功率非常重要,用户叫十次,有一次没成功,大家还能接受。但叫十次,有五次没成功,那产品就别卖了。
我们做了一个庞大的数据库,包含了不同音色、不同口音、不同环境音等各种素材。
开始是男性人员在测输入足够的语料,小溪都能够被唤醒。但同事拿回家后,发现老婆没法唤醒,于是又征集女性进行测试。
再后来,又发现小孩子没法唤醒,又开始征集小孩子。不过进展不太顺利,我们找不到足够的儿童录语料。”
“我跟昌平教育局说一下,让他们帮忙,200个孩子够么?”姚远道。
“够了够了!”
“嗯,继续!”
姚远示意,王斌以前做科研工作,可能从来没接触过这样的,愣了两秒钟才道:“通过深度学习,不断训练优化,让小溪达到我们想要的效果。
小溪有了耳朵,还要有嘴巴。
所以还有一套语音生成技术,将文本转化成语音,你们刚才听到的,是我们用拟人语音合成技术做出来的。
现在还有些僵硬,理想效果是与真人无异,连人类说话时的犹豫、停顿、变速、叹息等都能模拟,但这可能是很久以后的成果了。”
“……”