无他,只是因为现实生活中没有恶龙来给他杀。一个杀鸡的可能都比他在现实生活中,更容易生存下去。
最后林奇决定还是自己来搞这个模型,不仅仅语音识别是需要大量的数据,现在所有的涉及到深度学习的都是需要大量的数据来进行训练。
林奇并不觉得这是绝对正确,就像我们人类一样,比如一个新奇的物种,并没有见过,然后你给他了一张照片,说这是神兽饕餮,然后等他再次看到的时候,他很容易就能认出来,那个是不是神兽饕餮。
林奇想做的是能通过少量的样本就能训练出来一个不错的模型,这样就可以解放语音的大数据。
同时一个人上手的时间更短,想想即使一个人口音很重,用了智能语音软件说了几十句话,或者十几句话之后,准确率大大提高,可以堪比用标准的新闻联播主持人那样的普通话说出来的识别率。
其实在自然语言方面,林奇之前有一些经验,是在创造自然语言编程的时候。
但是里面设计到的多是语义的一些解析,没有涉及到语音识别。
林奇相信只要自己能通过第一关卡,那么后面的应该都很简单。
为了这个目的,林奇疯狂的投入到了开发中。
林奇把每一个的汉字读音都收集了起来,然后有语料数据的时候,林奇把这个语料做了一个分类。
一个是标准读音串起来的语音,一个是真实的语音。
林奇先处理了真实语音,把真实语音分成了环境音和人声。
接着又拿出来人声和原来的标准读音进行对比,找出来了两者的差异。
经过不懈的努力,还真的找出来了同一个人在说不同话的时候有一些相同的东西。
就像不同地方的人有不同地方的口音一样,一个人说话的时候,与标准的普通话有固定的“偏差”。
找出来了这个“偏差”,林奇非常兴奋,他觉得这个可能是他最近一段时间研究,最大的成果了。
有那个处于地下四层之下的量子生物计算机的强大后盾,林奇研究出来了这个“偏差”,又基于这个做出来了一套新的语音模型。
这种新的模型,与市面上的模型都不一样,市面上的模型都是一个固定的,比如用户和b用户安装后得到的都是一样的模型。
而这个不一样,开始安装的时候都是一样的,但是人们说的话越多,他得到的数据越多,就越精确,并且模型会根据这个人的语音输入而变化,以至于可以达到千人千面,甚至亿人亿面。
这也是因为第二智慧科技有生物计算机在后面作保证的,如果没有这些功能和存储都很厉害的生物计算机,这是不可能实现的。
第二智慧科技也有一支团队在做语音识别,不过他们就是按照常规的深度学习来做的建模。
最近他们遇到了一个问题,找到了林奇这里。