作為深度學(xué)習(xí)時(shí)代自然語言處理的最廣泛傳播的詞嵌入工具word2dec,也就是把文本轉(zhuǎn)化為向量,在今年,13年初,就已經(jīng)由谷歌發(fā)布了的一篇。
另外一篇,更為迅速的方法,涉及到負(fù)采樣和nce-loss的技術(shù)要點(diǎn)的論文,是谷歌到今年10分份才發(fā)表的,莫浩波有足夠的時(shí)間,去完成這篇論文。
事實(shí)上,跟著莫浩波穿越而來的筆記本電腦,上面就有谷歌的這篇論文。
不過,如果原封不動(dòng)地照抄上去,顯然是不行的,因?yàn)閿?shù)據(jù)集啊,有的數(shù)據(jù)集是谷歌新公開的,不能用。只能用一些公開的測試集,英文的中文的。
不過即便是沖突了,莫浩波也絲毫不擔(dān)心,因?yàn),莫浩波手里還有另外一篇論文呢,就是證明啦。
沒錯(cuò),就是證明。
實(shí)際上,為什么能夠使用負(fù)采樣以及nce,谷歌這時(shí)候也是沒有證明的,是要17年還是18年來著,才證明的,所以,即便慢了點(diǎn)撞車了,莫浩波也相信,他才是發(fā)明者。
能證明,對比不能證明的東西,成果歸誰那還不是顯而易見的么?要是谷歌再配合炒一炒,讓莫浩波混到個(gè)天才少年的稱號,那就更有意思了。
不過,想想莫浩波還是放棄了,果然悶騷如他,這時(shí)候是不會挑釁的。
現(xiàn)在莫浩波人微言輕,能避免糾紛什么的,還是避免的好,不要給對手一絲一毫的機(jī)會,已經(jīng)把自己看成中國乃至世界的,人工智能領(lǐng)導(dǎo)者的莫浩波,心中暗自計(jì)較。
果然還是我們這些歷史虛無主義有戰(zhàn)斗力啊。
工科類、學(xué)術(shù)類專業(yè)需要寫的論文,果然還是需要做實(shí)驗(yàn)的。
雖然莫浩波前世工作時(shí)候copy實(shí)現(xiàn)過word2vec的兩種方式,cbow模型和skip-gram模型,不過那是python3.5實(shí)現(xiàn)的,現(xiàn)在不知道python3出來了沒有。
不過能夠抄抄抄也是很好的,現(xiàn)在在筆記本的windows系統(tǒng)d盤下,保存著他前世工作后學(xué)習(xí)和編寫的所有代碼,也是很爽的一件事情。
不就是把py3轉(zhuǎn)為py2嘛,那真是小菜一碟,不過就是訓(xùn)練數(shù)據(jù),測試數(shù)據(jù)集麻煩了一點(diǎn),就這手機(jī)的網(wǎng)速這流量,一個(gè)數(shù)據(jù)集都下不完就gg了,看來還是要跑一趟網(wǎng)吧或者同學(xué)家啊。
網(wǎng)吧什么的還是太危險(xiǎn)了,莫浩波可是不敢上去的,尤其是這種地方。
記得小時(shí)候去游戲廳都讓人搶過,現(xiàn)在如此瘦小的他,一個(gè)人可是不敢去的。
網(wǎng)癮少年小學(xué)生什么的,想想還是很可怕的。記得他的幾個(gè)同學(xué),就是因?yàn)榫W(wǎng)癮了,讀不進(jìn)去書,落到了連初中沒畢業(yè)就外出務(wù)工的境地,真是太恐怖了。
再說小學(xué)生砍了人估計(jì)還能被原諒,從頭再來,莫浩波可不能給他們送經(jīng)驗(yàn),也不能引誘他們犯罪。
網(wǎng)吧不去那就只好去鎮(zhèn)上或者縣
【精彩東方文學(xué) www.nuodawy.com】 提供武動(dòng)乾坤等作品手打文字版最新章節(jié)首發(fā),txt電子書格式免費(fèi)下載歡迎注冊收藏。