精彩东方文学

黑科技超級(jí)輔助 第197章 語(yǔ)音識(shí)別

作者/雪天蛤蟆跳跳 看小說(shuō)文學(xué)作品上精彩東方文學(xué) http://www.nuodawy.com ,就這么定了!
    智能音箱的硬件和一些生態(tài)內(nèi)容,都已經(jīng)搞定了,就差一個(gè)智能的軟件了。

    要說(shuō)智能音箱,智能才是他的心臟部位。

    但是智能這個(gè)詞語(yǔ),聽(tīng)起來(lái)很簡(jiǎn)單,無(wú)非就是兩個(gè)字,但是做起來(lái)卻是“蜀道難,難于上青天!边@種感覺(jué)。

    就拿那個(gè)喚醒詞來(lái)說(shuō)吧,林奇決定要把那個(gè)喚醒詞去掉,可是研究了很久,還沒(méi)有研究到去掉喚醒詞的地步。

    因?yàn)樵诘谝徊降臅r(shí)候就被束縛了手腳,那就是語(yǔ)音識(shí)別。

    近些年來(lái)人工智能里面的機(jī)器學(xué)習(xí)發(fā)展的很是厲害,尤其是機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)。

    深度學(xué)習(xí)利用的是大于3層的神經(jīng)絡(luò)來(lái)學(xué)習(xí),有輸入層,輸出層,中間還有很多隱藏層。

    只需要把大量的數(shù)據(jù)提供過(guò)來(lái),輸入給寫(xiě)好的程序,運(yùn)行一段時(shí)間之后,就會(huì)計(jì)算出來(lái)一個(gè)模型。

    輸入的數(shù)據(jù)越多,運(yùn)算的次數(shù)越多,一般情況下得出來(lái)的結(jié)果也越好。但是這里面還有一個(gè)需要注意的就是不能太依賴于輸入的數(shù)據(jù)了,否則會(huì)出現(xiàn)過(guò)擬合的現(xiàn)象。

    過(guò)擬合就是在給定的數(shù)據(jù)中,讓程序來(lái)預(yù)測(cè)某些結(jié)果,它能達(dá)到很高的準(zhǔn)確性,比如99999,但是到了通用的數(shù)據(jù)下,這個(gè)模型表現(xiàn)的就很差,可能只有的準(zhǔn)確性。

    林奇開(kāi)始的時(shí)候也是利用了深度多層神經(jīng)絡(luò)來(lái)進(jìn)行訓(xùn)練語(yǔ)音樣本的,因?yàn)楝F(xiàn)在市面上最流行的就是種方法。

    不過(guò)別的公司能采用這種是因?yàn)樗麄冇泻芏嗟囊纛l資料,并且都是用戶自己上傳的一些音頻素材,比如深信,月活躍量一度超過(guò)10億人,可想而知,每天用它發(fā)語(yǔ)音的有多少人,他能收集到多少的語(yǔ)音片段。

    再比如尋她、搜貓和可大訊飛,他們?nèi)夜径加凶约旱妮斎敕,每一個(gè)人都說(shuō)自己的語(yǔ)音識(shí)別準(zhǔn)確率最高,在手機(jī)上用這三種輸入法的大有人在,當(dāng)然雖然在一些環(huán)境下用語(yǔ)音輸入很是麻煩,但是有一些特定的環(huán)境還是很不錯(cuò)的。

    所以他們收集到的來(lái)自真人的各種場(chǎng)景的語(yǔ)音片段,也是非常豐富的。

    像上面的這些公司他們使用深度神經(jīng)絡(luò)來(lái)訓(xùn)練語(yǔ)音模型,沒(méi)有任何問(wèn)題。

    但是第二智慧科技沒(méi)有聊天工具,也沒(méi)有語(yǔ)音輸入法,林奇也想過(guò)去這些公司買(mǎi)一些數(shù)據(jù),用來(lái)訓(xùn)練自己的語(yǔ)音識(shí)別庫(kù),但是思來(lái)想去,還是落了下乘。

    第二智慧科技要推出的智能音箱,最主要的一個(gè)環(huán)節(jié)的原料卻是從別人那里購(gòu)買(mǎi)的,雖然沒(méi)有什么問(wèn)題,但是林奇總覺(jué)得很別扭。

    后來(lái)林奇也想過(guò)去各大站上面爬一些數(shù)據(jù),有生物計(jì)算機(jī)在后面給自己的大力支撐,爬別人的數(shù)據(jù),應(yīng)該很方便。

    林奇也真的去這么做了,為了n頻率,還特意的n了一些速度。就這樣爬了一些數(shù)據(jù),但是這些數(shù)據(jù)拿到手里,林奇發(fā)現(xiàn)有一個(gè)問(wèn)題,那就是這些數(shù)據(jù)很多都是錄音棚,或者加工后的數(shù)據(jù)。

    與用戶實(shí)際生活中,比如在地鐵上發(fā)的語(yǔ)音,在公交車上發(fā)語(yǔ)音,或者在大街上發(fā)語(yǔ)音,在家里發(fā)語(yǔ)音都不太一樣,爬出來(lái)的數(shù)據(jù)很多都沒(méi)有環(huán)境音。

    沒(méi)有環(huán)境音本身其實(shí)是好的音頻,但是對(duì)于做語(yǔ)音識(shí)別來(lái)說(shuō)這個(gè)就非常不合適了,因?yàn)樽龀鰜?lái)的模型不符合人們正常生活,與實(shí)際使用場(chǎng)景不符。

    那就很尷尬了,就好比你說(shuō)一個(gè)人很厲害,可以用劍殺惡龍,在有惡龍的世界里面,他是當(dāng)之無(wú)愧的英雄。

    但是如果他來(lái)到了現(xiàn)實(shí)生活中,就一事無(wú)成。

    無(wú)他,只是因?yàn)楝F(xiàn)實(shí)生活中沒(méi)有惡龍來(lái)給他殺。一個(gè)殺雞的可能都比他在現(xiàn)實(shí)生活中,更容易生存下去。

    最后林奇決定還是自己來(lái)搞這個(gè)模型,不僅僅語(yǔ)音識(shí)別是需要大量的數(shù)據(jù),現(xiàn)在所有的涉及到深度學(xué)習(xí)的都是需要大量的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練。

    林奇并不覺(jué)得這是絕對(duì)正確,就像我們?nèi)祟愐粯,比如一個(gè)新奇的物種,并沒(méi)有見(jiàn)過(guò),然后你給他了一張照片,說(shuō)這是神獸饕餮,然后等他再次看到的時(shí)候,他很容易就能認(rèn)出來(lái),那個(gè)是不是神獸饕餮。

    林奇想做的是能通過(guò)少量的樣本就能訓(xùn)練出來(lái)一個(gè)不錯(cuò)的模型,這樣就可以解放語(yǔ)音的大數(shù)據(jù)。

    同時(shí)一個(gè)人上手的時(shí)間更短,想想即使一個(gè)人口音很重,用了智能語(yǔ)音軟件說(shuō)了幾十句話,或者十幾句話之后,準(zhǔn)確率大大提高,可以堪比用標(biāo)準(zhǔn)的新聞聯(lián)播主持人那樣的普通話說(shuō)出來(lái)的識(shí)別率。

    其實(shí)在自然語(yǔ)言方面,林奇之前有一些經(jīng)驗(yàn),是在創(chuàng)造自然語(yǔ)言編程的時(shí)候。

    但是里面設(shè)計(jì)到的多是語(yǔ)義的一些解析,沒(méi)有涉及到語(yǔ)音識(shí)別。

    林奇相信只要自己能通過(guò)第一關(guān)卡,那么后面的應(yīng)該都很簡(jiǎn)單。

    為了這個(gè)目的,林奇瘋狂的投入到了開(kāi)發(fā)中。

    林奇把每一個(gè)的漢字讀音都收集了起來(lái),然后有語(yǔ)料數(shù)據(jù)的時(shí)候,林奇把這個(gè)語(yǔ)料做了一個(gè)分類。

    一個(gè)是標(biāo)準(zhǔn)讀音串起來(lái)的語(yǔ)音,一個(gè)是真實(shí)的語(yǔ)音。

    林奇先處理了真實(shí)語(yǔ)音,把真實(shí)語(yǔ)音分成了環(huán)境音和人聲。

    接著又拿出來(lái)人聲和原來(lái)的標(biāo)準(zhǔn)讀音進(jìn)行對(duì)比,找出來(lái)了兩者的差異。

    經(jīng)過(guò)不懈的努力,還真的找出來(lái)了同一個(gè)人在說(shuō)不同話的時(shí)候有一些相同的東西。

    就像不同地方的人有不同地方的口音一樣,一個(gè)人說(shuō)話的時(shí)候,與標(biāo)準(zhǔn)的普通話有固定的“偏差”。

    找出來(lái)了這個(gè)“偏差”,林奇非常興奮,他覺(jué)得這個(gè)可能是他最近一段時(shí)間研究,最大的成果了。

    有那個(gè)處于地下四層之下的量子生物計(jì)算機(jī)的強(qiáng)大后盾,林奇研究出來(lái)了這個(gè)“偏差”,又基于這個(gè)做出來(lái)了一套新的語(yǔ)音模型。

    這種新的模型,與市面上的模型都不一樣,市面上的模型都是一個(gè)固定的,比如用戶和b用戶安裝后得到的都是一樣的模型。

    而這個(gè)不一樣,開(kāi)始安裝的時(shí)候都是一樣的,但是人們說(shuō)的話越多,他得到的數(shù)據(jù)越多,就越精確,并且模型會(huì)根據(jù)這個(gè)人的語(yǔ)音輸入而變化,以至于可以達(dá)到千人千面,甚至億人億面。

    這也是因?yàn)榈诙腔劭萍加猩镉?jì)算機(jī)在后面作保證的,如果沒(méi)有這些功能和存儲(chǔ)都很厲害的生物計(jì)算機(jī),這是不可能實(shí)現(xiàn)的。

    第二智慧科技也有一支團(tuán)隊(duì)在做語(yǔ)音識(shí)別,不過(guò)他們就是按照常規(guī)的深度學(xué)習(xí)來(lái)做的建模。

    最近他們遇到了一個(gè)問(wèn)題,找到了林奇這里。

【精彩東方文學(xué) www.nuodawy.com】 提供武動(dòng)乾坤等作品手打文字版最新章節(jié)首發(fā),txt電子書(shū)格式免費(fèi)下載歡迎注冊(cè)收藏。
百度風(fēng)云榜小說(shuō):劍來(lái) 一念永恒 圣墟 永夜君王 龍王傳說(shuō) 太古神王 我真是大明星 校花的貼身高手 真武世界 劍王朝
Copyright © 2002-2018 http://www.nuodawy.com 精彩東方文學(xué) All Rights Reserved.
小說(shuō)手打文字版來(lái)自網(wǎng)絡(luò)收集,喜歡本書(shū)請(qǐng)加入書(shū)架,方便閱讀。
主站蜘蛛池模板: 衢州市| 湘西| 鄂尔多斯市| 弋阳县| 佛山市| 南投市| 原平市| 双鸭山市| 准格尔旗| 桐庐县| 土默特右旗| 高唐县| 措勤县| 曲水县| 东兰县| 屯昌县| 昭平县| 东辽县| 平乡县| 克拉玛依市| 江城| 夏邑县| 巴林右旗| 体育| 德钦县| 双牌县| 龙里县| 双桥区| 牙克石市| 湄潭县| 察哈| 洛阳市| 鄯善县| 巨野县| 个旧市| 黑山县| 兴安县| 门源| 翁牛特旗| 夏邑县| 凭祥市|