第180章 圍棋軟件的工作原理(第2/2頁)
模仿人類棋手的思考模式,快速將一些低概率的點淘汰掉。
柯傑嘆了口氣:“看來,到時候我還要提供目前為止所有人類的對局棋譜了。”
理論上而言,棋譜數量越多,策略神經網絡的成熟度也越高。
“這一點,我們讓計算機自主學習。”元霄指出其中的關鍵。
反復推演學習的結果,將會使策略神經網絡更加強大,選點更為準確。
“而要做到這一步,還需要另外一個神經網絡的結合。”元霄寫下一個公式。
價值神經網絡。
其作用是能夠計算出,每個選點的勝率。
每一步都進行這樣的估值判斷,直到棋局的結束,得到最精準的勝率數值。
而同樣,這東西也可以自己學習。
總結起來其實很簡單。
就是模擬人類下棋的思維。
首先判斷在哪些地方可以下,每個地方的勝率是多少。
然後對這些選點進行集中計算,推演出最後的結果。
每一步都這麽執行。
那麽得到的每一手,自然就是最佳的下法。
如果說一開始柯傑覺得元霄說的是天方夜譚。
到了現在,他感覺這東西並不是完全不可能實現的了。
他咽下口水:“如此一來的話,那不是一開始的時候,計算機就已經鎖定了結果。”
必勝的結果。
傲世指數+8888
“這只是大概的概念,實際我們還需要一步步來,”元霄放下筆,“柯院長,到時候和圍棋軟件的對弈,還需要你來。”
柯傑表示責無旁貸。
蘇辰逸、卓越、方旭堯幾個都聽懂了。
夏晚晴黎沐嵐之流,當然是不知所雲。
尤其是夏晚晴,她表示很鄙視。
花腦袋去開發這玩意有啥用。
老師也真是的,有時間和我一起不香麽。
計算機的世界,果然蘊含宅的屬性。