第98章
書迷正在閱讀:知更鳥、死對(duì)頭老公出軌觀察日記、707公交游客守則[無限]、我們不熟(一見鐘情 1v1 h)、百慕(1V2 h)、何所欲也、乖乖女(SM)、未來前夫失憶了(1v1)、背德專題(短篇合集)、養(yǎng)成日記gl (簡體版)
寇局長心道“女人的視角真特別”,嘴上贊道:“王老師,你應(yīng)該到信安部來工作!這種灰歷史、黑材料,我的分析師守著那么大數(shù)據(jù)庫都拿不出來。他們只知道這次美國軍方反對(duì)戈德曼出席,但議會(huì)和情報(bào)社團(tuán)支持,完全倒過來了。這也很奇怪。” “我知道的其實(shí)都是公開信息,雞零狗碎泡在媒體里面。我每天至少讀三個(gè)小時(shí)西方媒體。職業(yè)病,對(duì)心理健康很不好。” 張翰看了幾眼大人物們,忽然在王招弟耳邊道:“等下我換到第六排來,坐你旁邊。行不行?” 「–」 國務(wù)卿和蘭道中將目不斜視穿過了拱門。戈德曼停在圖海川面前。四周的人群都靜下來,豎起耳朵。 “你第一個(gè)講,我第二個(gè)講。對(duì)嗎?” 圖海川點(diǎn)頭:“是的。現(xiàn)在我們就別廢話了。” 戈德曼眼中放光,拍拍圖海川的肩膀,昂首進(jìn)門。 第24章 造物 圖海川獨(dú)坐講臺(tái),當(dāng)真一句話都不肯浪費(fèi)。 「–」 “2025年,我受命為阿里集團(tuán)正在運(yùn)作的國際網(wǎng)購平臺(tái)開發(fā)一款多語言翻譯系統(tǒng)。當(dāng)時(shí)我還不是項(xiàng)目負(fù)責(zé)人,只是技術(shù)方面的總設(shè)計(jì)師。設(shè)計(jì)目標(biāo)有兩個(gè):一是自動(dòng)翻譯所有的網(wǎng)頁界面文字,二是為作為阿里旺旺的內(nèi)嵌翻譯支持,讓使用各種語言的人可以直接交談,同時(shí)處理語音和文字翻譯。你們有些人可能沒聽說過旺旺,因?yàn)樗呀?jīng)被這個(gè)內(nèi)嵌反過來吞并了。網(wǎng)購平臺(tái)也是這樣——本來它定了個(gè)名字叫‘世界寶’。現(xiàn)在,這些都通稱‘萬國寶’。所以先澄清一點(diǎn):現(xiàn)在我談到的萬國寶,不是指網(wǎng)購平臺(tái)也不是從前的旺旺,專指我設(shè)計(jì)的人工智能翻譯系統(tǒng)。到這個(gè)定義需要改變的時(shí)候,我會(huì)提醒你們。 “這個(gè)項(xiàng)目本來不應(yīng)該存在。因?yàn)樵?025年,谷歌的人工智能翻譯技術(shù)已經(jīng)很成熟。集團(tuán)內(nèi)部開預(yù)研會(huì),我的第一反應(yīng)是:為什么還要自己發(fā)明輪子?把谷歌翻譯嵌進(jìn)去不就行了嗎?當(dāng)時(shí)谷歌的自然語言翻譯產(chǎn)品除了谷歌翻譯,還有谷歌數(shù)字助理、谷歌duplex。三個(gè)內(nèi)核揉在一起再進(jìn)行二次開發(fā),恰好能滿足我們的需求。這些產(chǎn)品的接口也非常友好。 “開完會(huì)我就明白為什么了。萬國寶能夠出生,還得感謝您?!彼驀鴦?wù)卿點(diǎn)了點(diǎn)頭,“那時(shí)美國商務(wù)部由您主持,認(rèn)定谷歌的自然語言人工智能是戰(zhàn)略技術(shù)??梢宰屛覀儺?dāng)用戶,但不能嫁接在與美國企業(yè)競爭的阿里平臺(tái)上。那個(gè)合作才談了個(gè)意向,就被你砍掉了。我們只能另起爐灶?!?/br> 美國代表團(tuán)的譯員非常出色,幾乎同時(shí)說完。國務(wù)卿毫不介意,也笑著點(diǎn)頭。 “怎么做呢?還得用谷歌的東西。因?yàn)槟菚r(shí)候谷歌的tensorflow平臺(tái)幾乎統(tǒng)一了機(jī)器學(xué)習(xí)開發(fā)模式,已經(jīng)為自然語言ai提供兩種架構(gòu)。我們用它搭好架子,搞自己的局部算法就行了。2027年我們的系統(tǒng)已經(jīng)上線試運(yùn)行。水平還真的不錯(cuò),比谷歌翻譯公開版的正確率和擬人度還高一點(diǎn)。當(dāng)時(shí),我和谷歌的朋友霍桑聊天,在背后笑話你。我說你砍了商務(wù)項(xiàng)目,但沒法砍谷歌的開放ai標(biāo)準(zhǔn),這等于強(qiáng)行給我灌輸美國技術(shù)思想的精華。霍桑說你不但讓谷歌少掙了錢,又逼著中國ai產(chǎn)業(yè)補(bǔ)短板,將來還不受限制,都是‘開槍射自己的腳’。他已經(jīng)過世了,我不妨告訴你?!?/br> 這次國務(wù)卿面無表情。張翰相當(dāng)吃驚:什么時(shí)候圖海川說話這么囂張過?他現(xiàn)在腦漿溫度是有多高? “2027年的事你們應(yīng)該還記得。阿里低估了關(guān)稅問題和跨國物流的復(fù)雜。加上那時(shí)候世界很亂,各大市場的準(zhǔn)入標(biāo)準(zhǔn)也被人為收緊了。整整一年,各國先爭吵,再談判,越談越糊涂?!澜鐚殹喜涣司€,一拖就是十年,直到把自己的名字都拖沒了。萬國寶項(xiàng)目組倒是閑了下來。原先趕進(jìn)度,有很多功夫沒有做到位。從2028年開始可以坐下來慢慢改進(jìn)、反復(fù)琢磨。但是,到年底我就撞上了墻。 “那時(shí)的萬國寶翻譯網(wǎng)購平臺(tái)文字界面,幾乎做到了完美。不僅是標(biāo)準(zhǔn)文字,一張商品圖片上的中文它都可以立即識(shí)別、翻譯、改圖嵌入。麻煩出在真人交流,尤其是語音會(huì)話。當(dāng)時(shí)困擾我的有三個(gè)大問題:第一,它搞不懂諷刺。第二,它無法處理很多種修辭,特別是隱喻和指代。第三,遇到語境決定語意的情況就犯蒙。 “前兩個(gè)問題我用一個(gè)真實(shí)的內(nèi)測例子說明。測試員作為中國賣家掛出了恐龍蛋化石商品,一個(gè)美國買家向他詢問來源和真?zhèn)巍V袊u家一番解釋之后,美國買家說:‘yeah right! i too have an o front in nevada to sell you.’萬國寶的翻譯:‘真不錯(cuò)!我在內(nèi)華達(dá)州有一套海景房,也可以賣給你。’中國賣家聽了非常興奮,催他下單,說下單之后大家可以聊房地產(chǎn)?!?/br> 聽眾已經(jīng)笑倒了一片,譯員們笑得尤其厲害。 圖海川一本正經(jīng)繼續(xù):“后來的萬國寶是這樣翻譯的:‘老板實(shí)在!我有塊地皮在中南海,你買不買?’在座的人類很容易理解,這才是美國買家的本意。那么我們和后來的萬國寶有什么共同點(diǎn)?和以前的萬國寶又有什么不同?我們知道內(nèi)華達(dá)不靠海。我們起碼經(jīng)歷過幾百次別人說yeah right的場合。后來的萬國寶會(huì)把英語隱喻置換成類似的漢語隱喻,甚至使用類似的土鱉語氣,就像各位譯員剛才腦子里轉(zhuǎn)的彎。 “當(dāng)時(shí)我設(shè)想的解決方法是:把yeah right之類的常用短語,以及后面那個(gè)土味濃厚的美國俗語,分別歸入‘諷刺’和‘俗語’類型,各自用一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)層處理。但這也不能完全解決問題——你架不住隨時(shí)有人發(fā)明新俗語、新黑話。更架不住真的有人說yeah right,表示同意。這就是我剛才說的第三個(gè)問題:語境決定語意。這才是最廣泛、最無解的問題。漢語中尤其嚴(yán)重,‘大勝’等于‘大敗’之類,例子太多我就不啰嗦了。