262 比谷歌酷多了 (第2/3頁)

老實說,聽到這兒,陳舍已經有點理解困難了,喬伊也看出了這一點,他適當放慢了語速,但陳舍似乎依然難以跟上他的進度。

於是喬伊只能簡單化的給出結論:“以前,地球上是不存在符合語言學定義上的復雜語言的。但是現在……雖然不知道它是如何出現的,但我們認為,我們找到了……你知道這意味著什麽嗎?”

陳舍搖頭。

“意味著也許就在這顆星球上,某個大公司的機房裏,就存在著一些文明的構造——我說的未必是AI,但它們肯定是掌握語言規則的某種程序,或者某種……東西。”

“它們的語言之復雜……我學漢語的時候,知道漢語裏最難以被理解的,就是四個字四個字的成語,每一個成語都可以牽扯十幾個附帶詞匯的意向。”

“比如刻舟求劍,船,劍,船上的人,這是基本的,然後還有衍生的概念,水的遮蔽特性,相對於劍的密度特性,相對於人的危險特性……想象一下一個外星人要理解刻舟求劍這個詞,他需要理解多少衍生的附帶概念。最後,在完全理解了這些概念之後,他才有可能理解到成語本身特定指代的某種意向——是用來諷刺主觀意志因為忽略客觀條件的變化而導致的愚蠢行為。

“在英語裏,其實也有類似成語的短句,我就不細說了……”

“這種我們剛剛發現的機器語言,你知道,在它的語言庫裏,我們找到最復雜的‘成語’,有多少意向指代嗎?”

陳舍看著喬伊,他豎起兩個手指頭:“兩千多個……嚴格來說,它已經不能算是成語了,你知道,兩千多個意向,通常來說,也就是兩千多個詞匯。要表達這些詞匯,考慮到語句上必要的通順和前後的邏輯,用中文大概寫出來的話,就這一個詞,就可以展開寫一篇上萬字的小說了。”

“其實成語就可以看做是被高度壓縮的小說故事——但機器語言中,故事的復雜程度更高。想象一下這樣一個場景,一個外星人,在電腦上跟你聊天。他說了一句話,裏面包含兩個這樣的關鍵詞——這些詞用01全部表示出來,也就是一兩排而已。但翻譯出來,卻可以是長達幾萬字的內容。你可能需要認真的看20分鐘,再思考20分鐘,才會明白這兩個詞的含義——然後大喊一聲,太TM絕了!”

“所以,你們的任務……”陳舍嘗試著猜測:“是翻譯這種文字?”

“翻譯?”喬伊搖了搖頭,“這個說法太狂妄了。”

“狂妄?”

“翻譯的意思,是把對方文字的所有意思,都轉換成我們能夠理解的意向。但,就我剛才所說,兩個文明的復雜程度完全不是一個級別的——對方的一個詞,都能讓你思考一個小時……這還是最容易被理解的。你能想象,如果你回到原始社會,你對原始人說的話,可能被他們精準的翻譯嗎?”

喬伊說這話的時候,手上的這根煙正好快抽完,他吸進去最後一口煙霧,然後微微擡起頭來,把這煙霧朝著陳舍頭頂吐去,在他頭頂的上空形成了一小團的雲霧。這個動作不太禮貌,卻也顯得有點孩子氣。喬伊指著這團霧對他說:“更不用說,他們語言中,對時間的定義更加嚴格——同一個詞在不同語境下含義不同,你是中國人,很容易理解。但,如果一個詞在一天24小時的每一個小時裏,含義都不一樣呢?”

“舉個例子把,他們語言中有對應太陽一個詞的單詞,每一個小時的含義都不一樣……朝陽,夕陽,烈日,旭日……中文裏關於太陽的詞匯很多,但在這種機器語言中,太陽只是一個簡單不變的詞,但它的含義,卻比中文裏,所有帶有太陽的詞匯加起來還要多,你能想象嗎?”

“說翻譯……是癡心妄想,”喬伊接著說,“對我們來說,我們只是在瞻仰。就好像一個原始人,靠著一本缺了頁的教科書來學習中文,甚至學習唐詩三百首……當然,具體的語言規則,是由那些語言學專家來負責,我們做的這部分,是大概確定這種數字語言中,單個的字,簡單的數據匹配工作……整個項目中,最沒技術含量的。看著最忙,其實……”

喬伊搖搖頭:“這種感覺……哎,其實當程序員很少會有這種挫敗感,因為在絕大部分項目裏,都是我們來負責推進工作……”

陳舍卻點頭:“我懂,這感覺不好受。”

喬伊扔掉煙:“那,就說說你們公司吧……你們公司還招不招人?對了,中國的工作簽證你們可以搞定嗎?”

陳舍驚訝了一下:“這應該只會是個臨時的項目。”要是開個項目就要把人全部留下來,那青藍咨詢現在應該可以開個富士康了。

“我知道,雖然知道沒什麽希望,但還是要多問這一句,”喬伊道,“我很期待你們公司未來的項目……像這樣的項目,對我們來說,也許一輩子也碰不到一次,你知道嗎,我們項目組很多人甚至以為,你們政府已經發現了外星人,現在正讓我們跟對方交流。”