第0800章 薛明的粗暴方案

周敏溪又思考了半天,這時候終於提出一個優質的問題:“獅虎,你說為什麽谷歌自己不代理遊戲啊?谷歌提供了這麽多服務,幹脆自己代理遊戲豈不是無敵了?至少要比天朝大企鵝厲害的多吧?”

楚垣夕頓時一拍手:“這個問題非常好,如果谷歌肯代理《亂世出山》,卡著咱們的問題就全都解決了。莫妮卡,回答這個問題!”

“反壟斷法。”莫妮卡輕輕吐出四個字,“西方法律了解一下,同樣的問題也可以問臉書。天朝不拆分企鵝,在西方人眼裏絕對是奇葩中的奇葩。”

周敏溪似懂非懂的點點頭,擡頭一看,已經走到主會場。

今天的峰會分為主會場和分會場,主會場上谷歌大中華區的幹將們輪流登台,從天朝遊戲公司出海講起,講到google play上邊天朝公司的收入增幅,講遊戲開發生命周期中每一個階段可能遇到的挑戰,講國內外流行的遊戲品類又多大的不同,講的非常專業,聽的人懨懨欲睡。

楚垣夕也不例外,這都是天朝出海公司必做的功課。於是他決定讓莫妮卡留下來聽課做筆記,他去分會場轉轉再說。

之所以抱著極大的興趣來,楚垣夕的目的是為了套瓷,跟谷歌真正管事的人套瓷,然後爭取拿到谷歌的算力。

他不想把《亂世出山》推廣到歐美嗎?做夢都想賺€和$啊!推廣運營的事情有谷歌提供媽媽級貼心服務的情況下只要砸錢已經不是問題。

問題是別人的遊戲都可以愉快的出海,只要請翻譯翻好了就行,而翻譯的工作主要是UI,即使有劇情也很容易翻。但《亂世出山》經過東亞兩個區的出海檢驗,真不行。

更要命的是,後來楚垣夕和巴人遊戲的同事閉門研究了一下,就算是用外文小說進行訓練薛明的AI也並不好。

這個問題還是楊健綱百忙之中見縫插針提出來的,那就是這款遊戲的過圖節奏和建設玩法,最搭的內容就是天朝的網絡小說,換成英文小說進行訓練,就算取得足夠體量的英文小說授權,訓練出來保證變味。

天朝武俠是掉到崖下得到高人傳授神功,漫威裏是被蜘蛛咬了一口發生變異,訓練出來的東西很有可能沒法往現有的遊戲架構裏邊套。

楚垣夕一想也是,歐美小說無論通俗還是正統,就很少有類似的,人家那麽多年了就不流行這種意淫式的展開。

很多AI語意訓練項目直接拉網頁就能訓練,因為輸出的成果是不需要特定使用環境的,但遊戲不一樣,遊戲得有感覺,隨便訓練出來的東西沒感覺。《亂世出山》手遊的立項就是建立在這種網文感覺上的,所以才能讓AI劇情和遊戲內容無縫銜接,換一套訓練素材的效果,和瞎捷豹翻譯的效果到底哪個更糟糕還真不一定。

所以搞定實時翻譯的AI才是最直接的辦法,於是問題又回到薛明那。

然後薛明給了一個針對西方市場的粗暴的解決方案,那就是,不要什麽AI實時翻譯,把他用來訓練AI的幾十萬本網絡小說,統統都翻成英文,然後用英文版本訓練。

這相當於把一個問題拆成兩個。其中後一個問題不需要什麽新的工作量,而前一個問題,因為是定向解決到英語區國家推廣的問題,不用考慮翻譯成多國語言,也不用考慮普適性,只需要解決針對《亂世出山》的單一問題,於是變得非常直接。

這就變成了最簡單的機翻小說的問題了,一本幾百萬字,幾十萬本,無非就是一萬億字的體量,只要有優秀的翻譯算法和配套算力用於翻小說,不是問題!

問題是沒有合適的算法和算力。

理解自然語意比較常用的模型裏,百度的ERNIE適合漢語任務,而谷歌的BERT2.0雖然漢語英文都可以,但是主要創新點都在預訓練上。對於長句語意的理解還行,但對翻譯既不友好也不那麽準確,特別是完形填空能力比較一般,連百度都不如。

而薛明要的是翻譯小說,比翻譯普通文本的要求高很多。BERT2.0的翻譯實力翻個普通的文本都勉強,翻小說根本沒法用。

所以還是OpenAI的GPT-2最合適,哪怕是閹割過的GPT-2。

於是問題轉了一個超大的圈子又回到最開始訓練GPT-2模型的問題了,谷歌的TPU雲資源最合適,退而求其次的選項是國內的一些私有雲。

這個問題必須解決,否則如果還是原先的翻譯水平,經過島國和宇宙兩個區的實踐,《亂世出山》手遊海外運營的天花板實在是太低了,強行降低一半多的高度,簡直不能忍。

所以今天楚垣夕必須來找谷歌要機會,國內的私有雲實在是一言難盡,可能必須向中曙光或者江南計算申請算力了,麻煩地令讓人頭禿。