第0768章 技術上被人卡脖子

薛明廬山瀑布汗,心說咱們是白嫖人家的啊喂,搞得升米恩鬥米仇的至於的嗎?

其實他培訓《亂世出山》的劇情AI過程中已經抓了GPT-1裏面很多結構了,這個AI是無人監督培訓,非常節約人力,給薛明省了很大的力氣,因此他在情節編纂方面極大仰仗了OpenAI的成果,當然自己的成果也很多。

OpenAI是矽谷許多大佬聯合組織起來的一股AI研究力量,可以說是集中了AI領域的頂級資源,而且因為是非營利組織,所以非常大方,基本上研究出來的東西都是大大方方開源的,非常nice。

但是這次不一般,因為這次的研究成果GPT-2實在是太秀了,如果用來造謠,整個互聯網都能被毀掉。

這個AI如果敞開了編,是絕對可以以假亂真的,因為各種寫作要點了然於胸,套路非常嫻熟,而且出貨特別快,配上一個自動分發消息的自媒體登錄發布腳本,無敵了!它能把假消息編成連續劇,邏輯極度完備的那種,給它一個開頭它就能編出一整套謠言來,越是成熟有理智的人越容易信。

它甚至還能跟人辯論,因為具備閱讀理解的功能,至於問答都是小case,這也是GPT-2比較容易改造成翻譯AI的原因。

所以OpenAI不發布完整的預訓練模型,也不發布經過訓練的模型,開發者只能從Github裏拿到閹割版。即使是閹割版的,也比海外版《亂世出山》使用的商業化翻譯的質量好了很多,這一點是讓周敏溪親自體驗過的。

這算一個閹割過的好消息。但楚垣許不爽啊,如果沒有好的也就算了,有好的但是只能用一個沒雞雞的,這算怎麽回事?

“哎薛明,你說這算是算是OpenAI給了題目又給了答案?咱們能不能逆向工程把解題過程給推導出來?咱把他解出來,然後往Github上一放,你說多酷?全世界的攻城獅都知道咱們牛逼了。再說也不能慣著OpenAI啊,不能給他們開這個敝帚自珍的口子你說是不是?”

薛明面色一變:“呃……能是肯定能,但是需要時間!”

“需要多久?”

“這個……咱們沒有算力,需要很久很久很久。”

“這怎麽會沒算力呢?國內雲計算資源這麽充足,咱花錢買算力不就得了?”

薛明為難的說:“不是,咱們買不到TPU的雲資源啊,這個AI訓練靠普通的CPU是非常低效的,GPU也差點,最好是TPU。但是國內沒有。”

“TPU不是谷歌那套張量流的專用處理器嗎?你訓練深度學習模型用的也是張量流模型?”

“對對對,國內是有一些可以作為替代的開源庫,阿裏百度也在建設雲資源,不過最好還是用谷歌的TPU,不然有點費勁。”他說完,又找補一句:“國內用張量流的人是最多的啊。”

“有沒可能向谷歌申請算力?我記得谷歌是有相關算力對外供應的吧?而且完全免費。”

“有,但是不會給咱們,那是給非商業化用戶進行研究的,咱們這個吧,雖然也算研究,但是……”

“臥槽!”楚垣夕一拍大腿,為這事對谷歌謊報研究計劃,偽裝一個個人的身份對薛明來說倒也不是不可以,但是一旦爆出來,巴人的估值會大受影響,甚至要賠錢,這風險是楚垣夕不可能承擔的。

但是谷歌早早就退出天朝了,國內買不到谷歌的服務。而薛明使用人家的架構,自己培訓個AI沒問題,但是涉及到逆向工程這種會遇到算力瓶頸的就沒轍了。

換言之,楚垣夕終於親身感覺到技術上被人卡脖子的狀況了,享受了一把科技前沿企業才能享受到的待遇!

“這樣我就更想把它搞出來了!”楚垣夕拍完大腿直接把小康的CTO和CSO給找了過來,簡單說了一下情況,然後問:“咱們有沒可能保證技術獨立?”

“有這個必要麽?”周鳴鈞很詫異,“現在的科技界是大雜燴的趨勢啊,根本切割不開的,咱沒必要杞人憂天吧?”

沒想到楚垣夕沒說話,曹翔沒說話,反而是薛明開口了:“那可不一定啊,萬一米帝要求微軟把Github給咱斷開呢?”

“你說啥?”周鳴鈞看傻逼一樣看薛明,他倆是同行,都是搞AI的,雖然沒到分個高低見個輸贏的地步,而且分處兩家公司理論上沒有什麽利益糾葛,但是幾次見面之中難免有點怪怪的。

“斷Github啊,很難想象嗎?有Github,國內人工智能跟米帝基本持平,落後幾個月的感覺,沒有Github直接打回去十年。現在兩國科技競爭這麽激烈,這都難說的事。斷別的對米帝有影響,斷Github米帝毫無損傷啊,築個墻就行的事。”

Github是一個開源庫托管平台,因為形式先進脫穎而出,能共享能討論,雪球越滾越大,現在全世界的攻城獅都在上面貢獻自己的代碼,其中尤其以AI方面的攻城獅對它的依賴為大。