第246章 漢語的優劣勢(第2/2頁)

“現代信息學用熵來衡量平均信息量,熵表示指定符號出現的不肯定性。西文字母采用的拼音文字字母有30個左右,漢語以方塊字為書寫單位,數目成千上萬,顯然其隨機出現的不肯定程度比西文字母的不肯定程度要大得多,從這一角度講每個漢字載荷的信息量遠遠大於一個字母的信息載荷量。”

“我們經過統計計算,得出法語字母的零階熵值為3.98比特,意大利字母零階熵值為4.00比特,西班牙字母零階熵值為4.01比特,英語字母的零階熵值為4.03比特,德語4.10比特,羅馬尼亞語為4.12比特,俄語為4.35比特。”

“英語詞的零階熵為10.0比特,漢語詞的零階熵為11.46比特,這表明漢語的詞義也比英語豐富。”

王正陽一邊說,旁邊有人開始打開投影儀,播放出他們對漢語和英語差異方面的研究成果。

“因為我們的漢語太過言簡意賅,一個字、一個詞表達的意思太豐富了,同樣的一個字一個詞在不同的場合下,語氣下,意思就完全不一樣。”

“因而由漢字組成的句,它的意思就更加的豐富,往往非常簡單的一句話,它卻是擁有多個意思。”

“比如能穿多少是多少?”

“這一句非常簡答的話,它就有兩種意思,一種是盡可能的多穿衣服,一種是盡可能的少穿衣服,兩種意思完全不同,可是偏偏又是同樣的一句話。”

“本來語言精簡是非常不錯的一件事情,但是在計算機領域內,因為計算機從根本上來說,它是一種精準的計算。”

“意思表達不明確,它就根本沒有辦法去計算。”

“相反英語就比較冗長,但是冗長歸冗長,冗長度高的語言結構性好,語言信息表達精確,糾錯能力強,利於計算機的計算、編程等等。”

秦毅仔細的聽著,王正陽講的這些東西一聽就懂,對於計算機也深入學習過的秦毅自然就明白。

“據我所知,程序編碼的過程當中是盡可能的要求精煉,按理來說我們漢語的優勢應該是更明顯才對。”

聽到這裏,秦毅想了想提出了自己的疑惑。

“你說的不錯,從計算機發展的歷程來說,編程方面一直都要求精煉,特別是在計算機剛剛發展起步的時候,因為存儲容量有限,編碼都是盡可能的精煉。”

“這就好比是我們古代,在還沒有發明紙張之前,書寫僅僅只能夠在羊皮、竹子上面的時候,因為書寫材料制作不已,所以書寫的時候都盡可能的簡練,於是有了我們現在的文言文。”

“但是精煉歸精煉,計算機說到底還是一種運算,一種計算方式,精煉也要表達出準確的意思才行,我們漢語意思太豐富,精煉是絕對夠,但表達的意思太過豐富,它對於計算就帶來了巨大的困擾。”

聽到秦毅的話,王正陽點點頭,他是計算機文字信息處理方面的專家,對這些東西都很懂。

“那這樣說來,漢語編程和漢語系統是不可能實現了?”

聽到這裏,秦毅忍不住皺起了眉頭,聽這王正陽的話,總覺得讓人比較郁悶外加氣憤,心裏面都考慮著要不要換過一個人過來主持這個工作。

這還是秦毅第一次動了換人的年代,一直以來秦毅都沒有換過任何一個研究單位的負責人,但是這次,秦毅真的有點動了這個年代了。

“不~這英語可以實現,我們漢語也可以實現。”

“因為我們的漢語表達的意思更加的豐富,我認為在未來計算機發展的歷程當中,我們漢語的優勢會越來越明顯。”

“另外,計算機是計算機,語言是語言,這英語可以,我們漢語也可以,其它的日語、阿拉伯語等等也都可以,本質上來說任何一種語言都是可以的。”

“只是我們可能是因為受到了英語的限制,受到了現有編程思維限制,一直無法打破英語編程和英語操作系統留下的條條框框,所以我們一直沒有什麽進展。”