作為深度學習時代自然語言處理的最廣泛傳播的詞嵌入工具word2dec,也就是把文本轉化為向量,在今年,13年初,就已經由谷歌發布了的一篇。
另外一篇,更為迅速的方法,涉及到負采樣和nce-loss的技術要點的論文,是谷歌到今年10分份才發表的,莫浩波有足夠的時間,去完成這篇論文。
事實上,跟著莫浩波穿越而來的筆記本電腦,上面就有谷歌的這篇論文。
不過,如果原封不動地照抄上去,顯然是不行的,因為數據集啊,有的數據集是谷歌新公開的,不能用。只能用一些公開的測試集,英文的中文的。
不過即便是沖突了,莫浩波也絲毫不擔心,因為,莫浩波手里還有另外一篇論文呢,就是證明啦。
沒錯,就是證明。
實際上,為什么能夠使用負采樣以及nce,谷歌這時候也是沒有證明的,是要17年還是18年來著,才證明的,所以,即便慢了點撞車了,莫浩波也相信,他才是發明者。
能證明,對比不能證明的東西,成果歸誰那還不是顯而易見的么?要是谷歌再配合炒一炒,讓莫浩波混到個天才少年的稱號,那就更有意思了。
不過,想想莫浩波還是放棄了,果然悶騷如他,這時候是不會挑釁的。
現在莫浩波人微言輕,能避免糾紛什么的,還是避免的好,不要給對手一絲一毫的機會,已經把自己看成中國乃至世界的,人工智能領導者的莫浩波,心中暗自計較。
果然還是我們這些歷史虛無主義有戰斗力啊。
工科類、學術類專業需要寫的論文,果然還是需要做實驗的。
雖然莫浩波前世工作時候copy實現過word2vec的兩種方式,cbow模型和skip-gram模型,不過那是python3.5實現的,現在不知道python3出來了沒有。
不過能夠抄抄抄也是很好的,現在在筆記本的windows系統d盤下,保存著他前世工作后學習和編寫的所有代碼,也是很爽的一件事情。
不就是把py3轉為py2嘛,那真是小菜一碟,不過就是訓練數據,測試數據集麻煩了一點,就這手機的網速這流量,一個數據集都下不完就gg了,看來還是要跑一趟網吧或者同學家啊。
網吧什么的還是太危險了,莫浩波可是不敢上去的,尤其是這種地方。
記得小時候去游戲廳都讓人搶過,現在如此瘦小的他,一個人可是不敢去的。
網癮少年小學生什么的,想想還是很可怕的。記得他的幾個同學,就是因為網癮了,讀不進去書,落到了連初中沒畢業就外出務工的境地,真是太恐怖了。
再說小學生砍了人估計還能被原諒,從頭再來,莫浩波可不能給他們送經驗,也不能引誘他們犯罪。
網吧不去那就只好去鎮上或者縣
【精彩東方文學 www.nuodawy.com】 提供武動乾坤等作品手打文字版最新章節首發,txt電子書格式免費下載歡迎注冊收藏。