蕭銘詳細(xì)閱讀著盤(pán)古語(yǔ)言的優(yōu)點(diǎn),最大的有點(diǎn)就是集成了人類(lèi)漢語(yǔ)的所有邏輯和規(guī)則,能夠?qū)⑷祟?lèi)語(yǔ)言表達(dá)意思直接告訴機(jī)器。
盤(pán)古語(yǔ)言如果使用在潘沙星的生物思維計(jì)算機(jī)上更能夠發(fā)揮作用,現(xiàn)在使用在二進(jìn)制計(jì)算機(jī)上,只能說(shuō)將功能發(fā)揮的勉勉強(qiáng)強(qiáng)。
接下來(lái),蕭銘將自己購(gòu)買(mǎi)的應(yīng)用套餐兌換為翻譯軟件。
電腦上出現(xiàn)了翻譯軟件的詳細(xì)編程步驟。
兌換的應(yīng)用套餐不會(huì)直接將應(yīng)用送給你,而是讓蕭銘實(shí)際操作,自己搗鼓一個(gè)程序出來(lái)。
授人予漁不是授人予魚(yú)就是這個(gè)道理。
蕭銘想著,其實(shí)自己的英語(yǔ)已經(jīng)進(jìn)步很大的了,語(yǔ)法的問(wèn)題已經(jīng)不大,最大的缺點(diǎn)是詞匯量少,聽(tīng)說(shuō)能力差,看得懂聽(tīng)不懂說(shuō)不會(huì)。
這也是大部分夏國(guó)學(xué)生學(xué)習(xí)英語(yǔ)的困境。
英語(yǔ)重要嗎?就現(xiàn)階段來(lái)說(shuō),肯定重要。人類(lèi)目前大量的技術(shù)科學(xué)都是來(lái)自于西方,英語(yǔ)不好連sci的論文都看不懂更別說(shuō)做學(xué)術(shù)了。
蕭銘這半年來(lái)最大的變化就是會(huì)自我反省,英語(yǔ)不好也要反省。
他可以抽寶箱,可以?xún)稉Q科技,但是這些科技產(chǎn)品也是建立在基礎(chǔ)科技知識(shí)之上。
要是蕭銘不懂基礎(chǔ)的生物知識(shí),他就不會(huì)培養(yǎng)吞噬1菌類(lèi),同樣,要是他不懂邏輯知識(shí)也絕對(duì)不會(huì)編程。不懂英語(yǔ)看不懂國(guó)外的學(xué)術(shù)也不會(huì)在科技上進(jìn)步。
天下沒(méi)有免費(fèi)的午餐,人生再有外掛也得努力。
回到計(jì)算機(jī)屏幕上,蕭銘有了一個(gè)大膽的想法,他需要的不僅是一個(gè)翻譯軟件,而是需要的一個(gè)能夠較為智能和自己進(jìn)行英語(yǔ)對(duì)話,盡快提高自己英語(yǔ)聽(tīng)說(shuō)水平的軟件。
按照盤(pán)古語(yǔ)言的編程說(shuō)明,蕭銘開(kāi)始動(dòng)手。
首先,在編程的頁(yè)面上,蕭銘書(shū)寫(xiě)著應(yīng)用軟件的總說(shuō)明能夠智慧準(zhǔn)確的相互翻譯英語(yǔ)和漢語(yǔ),并且能和用戶(hù)對(duì)話。
接下里就是程序的具體書(shū)寫(xiě)。
蕭銘英語(yǔ)詞匯量不足,但是語(yǔ)法沒(méi)有問(wèn)題。
蕭銘歸納,現(xiàn)今市面上的翻譯軟件和翻譯機(jī)最大的缺陷有兩個(gè)。
一個(gè)是詞不達(dá)意。無(wú)論是英語(yǔ)還是漢語(yǔ),通常會(huì)有多種意思,在不同的語(yǔ)境中有不同的解釋?zhuān)菣C(jī)器翻譯并不能完全了解人類(lèi)表達(dá)的意思。很多時(shí)候單詞的詞語(yǔ)意思準(zhǔn)確,但是放在句子中笑話百出。
還一個(gè)是無(wú)法識(shí)別人類(lèi)的語(yǔ)音。這主要出現(xiàn)在翻譯機(jī)上,每個(gè)人有很多種口音,生活中的對(duì)話有很多的俚語(yǔ),人和人之間對(duì)話時(shí)絕對(duì)不可能像央視主播那樣每句話都是語(yǔ)言要素齊全,語(yǔ)音標(biāo)準(zhǔn)。
機(jī)器翻譯在很多時(shí)候都會(huì)撿著聽(tīng)得懂的翻譯,聽(tīng)不懂的亂翻譯。這也是很多品牌的翻譯機(jī)拿到國(guó)外去應(yīng)用的時(shí)候讓顧客感到并不順心,翻譯機(jī)更不能作為會(huì)議同聲翻譯的原因。
為了處理上面兩個(gè)主要問(wèn)題,蕭銘按照說(shuō)明書(shū)的建議項(xiàng),編輯著。
蕭銘采用數(shù)學(xué)的思維,將每個(gè)詞語(yǔ)設(shè)定為向量,并且分類(lèi)為名詞、動(dòng)詞等等。
將詞語(yǔ)設(shè)定為向量的好處就是講長(zhǎng)難句進(jìn)行肢解,翻譯軟件處理時(shí)會(huì)將每個(gè)詞語(yǔ)準(zhǔn)確的翻譯。
接下來(lái)就是按照語(yǔ)言的語(yǔ)境篩選組合,將不同的詞語(yǔ)按照翻譯對(duì)象需要的語(yǔ)法和含義進(jìn)行組合,并對(duì)缺少的語(yǔ)法要素進(jìn)行補(bǔ)足。
在盤(pán)古編程語(yǔ)言的提示下,蕭銘知道自己編程的邏輯是正確的。
但是邏輯正確只是第一步,怎么讓擁有向量的詞語(yǔ)按照語(yǔ)法組合為新的語(yǔ)句,這個(gè)很難,這也是現(xiàn)代翻譯軟件和機(jī)器最大的難點(diǎn)。
沒(méi)有關(guān)系,這是盤(pán)古最擅長(zhǎng)的。
盤(pán)古給了蕭銘幾個(gè)接入入了口。
蕭銘將導(dǎo)入大量的中英文資料,資料不僅有名著更有口水話表達(dá)的網(wǎng)路小說(shuō)、貼吧問(wèn)答、微博、推特文章等等。
未來(lái)這些資料會(huì)可以由用戶(hù)們自己上傳,優(yōu)化程序的準(zhǔn)確性。
盤(pán)古的數(shù)據(jù)庫(kù)能將整合這些資料,熟悉每一個(gè)句子的語(yǔ)境,然后整理出數(shù)據(jù)模型。
這些數(shù)據(jù)會(huì)幫助“詞向量”在不同的語(yǔ)境和語(yǔ)法中出現(xiàn)在合適的位置,如此翻譯會(huì)更加準(zhǔn)確。
這項(xiàng)工作最大的難點(diǎn)就是編譯量非常大!
所以現(xiàn)今市面上現(xiàn)存的翻譯軟件都是采用語(yǔ)言學(xué)家總結(jié)的語(yǔ)法庫(kù),即便有少部分軟件有自我學(xué)習(xí)功能,也不能做到了解和統(tǒng)計(jì)當(dāng)今所有的語(yǔ)言習(xí)慣并對(duì)其作出分析。這也是現(xiàn)有翻譯軟件機(jī)械不智能錯(cuò)誤百出的原因。
剩下的一些接口,蕭銘將其接入全國(guó)各地的免費(fèi)直播間,直播間主播有用普通話有用地方語(yǔ)言,也屬于口語(yǔ)的表達(dá),最具有代表性。
盤(pán)古語(yǔ)言將搜集各地的語(yǔ)音和語(yǔ)氣將其歸類(lèi)編譯,最后形成語(yǔ)音數(shù)據(jù)庫(kù)和文字庫(kù)相對(duì)應(yīng)。
盤(pán)古編程使用方式很簡(jiǎn)單,不需要輸入代碼,只需要告訴邏輯意圖,當(dāng)蕭銘告訴邏輯和方式之后,編程語(yǔ)言就可以明確運(yùn)行。
然后……
然后計(jì)算機(jī)卡死了,卡得發(fā)燙!
蕭銘廢了半天功夫心血化為烏有。
勞資……
蕭銘購(gòu)買(mǎi)的筆記本是華碩的普通筆記本,用的是i78550處理器。
筆記本的處理器處理如此大量的數(shù)據(jù),不卡死才怪!
蕭銘看了下時(shí)間,已經(jīng)凌晨三點(diǎn)。
“我需要一組服務(wù)器。”蕭銘說(shuō)道,隨后他躺在床上繼續(xù)思考著語(yǔ)言翻譯和英語(yǔ)學(xué)習(xí)助手軟件的邏輯性問(wèn)題。
接下來(lái)的幾天,蕭銘在學(xué)校很沉默。
除了做必要的數(shù)學(xué)和理綜練習(xí)題以外,大部分時(shí)間都在做英語(yǔ)閱讀和語(yǔ)文閱讀。
學(xué)校小組的成員都知道蕭銘在水木大學(xué)老師離開(kāi)之后心情不怎么好,都沒(méi)有去打擾他。
幾天之后,蕭銘問(wèn)老爹要了十萬(wàn)塊的經(jīng)費(fèi),直接網(wǎng)購(gòu)了四組英特爾xeone52603v4芯片組建的服務(wù)器主機(jī),并且聯(lián)系人上門(mén)安裝。又花錢(qián)開(kāi)通了企業(yè)光纖專(zhuān)線。
蕭銘看著白花花的銀子今天時(shí)間就花沒(méi)了,也是肉痛。
兩個(gè)行業(yè)絕對(duì)是暴利!
一個(gè)是英特爾的芯片行業(yè),一個(gè)是電信的通訊行業(yè)!
安裝服務(wù)器的年輕師父看著幾天沒(méi)睡好覺(jué)有些滄桑猥瑣的蕭銘,偷偷說(shuō)道:“建直播網(wǎng)站?小兄弟,現(xiàn)在風(fēng)聲緊,服務(wù)器好還是租用海外的好點(diǎn),自己建設(shè)風(fēng)險(xiǎn)大!”
蕭銘無(wú)語(yǔ),“那你要不要先充個(gè)會(huì)員?可以一對(duì)一。”
師父嘿嘿笑了兩聲說(shuō)道:“不了不了。”
【精彩東方文學(xué) www.nuodawy.com】 提供武動(dòng)乾坤等作品手打文字版最新章節(jié)首發(fā),txt電子書(shū)格式免費(fèi)下載歡迎注冊(cè)收藏。