第0040章 搜索引擎算法(第2/2頁)

10個用戶用谷歌,5個人找到了自己想要的東西,如果用我們的搜索引擎,6個人找到了自己想要的東西,在這裏領域目前的技術環境下,我們就是更優秀的。

那麽在這個理解基礎上,我接下來要給大家介紹的,就是我的搜索引擎算法,動態規則超鏈分析算法。

動態規則超鏈分析算法有以下幾個變化。

第一,剛才我們提到了,好的搜索引擎是要看在同一關鍵詞下誰的反饋結果更能滿足用戶需求,那麽當用戶在搜索某個東西的時候,從大概率來說,他想要看到的結果應該是與這個東西具有更垂直型相關的內容。

舉個例子,客戶在搜索汽車的時候,不管他是想買車,還是想了解汽車知識,汽車類的專業網頁對他的幫助應該都是更大的。

所以在我的算法中,對於指向某一個網站的鏈接,我首先會做垂直率評分,比如有現在有10個網站鏈接到了A,這10個網站都是汽車類網站和這10個網站都不是汽車類網站的結果,想必是肯定不一樣的。

這裏還有一個小小的心理問題,那就是同行之間很少會做超鏈接,所以擁有更多垂直類網站鏈接的網站,它的專業性肯定比被亂七八糟網站鏈接的網站要更大概率靠譜。

第二,建立關鍵詞庫熱度排序機制,現在的幾家搜索引擎企業都對網頁做了排序,而我對關鍵詞也做了排序,而且給關鍵詞做排序非常簡單,那就是看用戶的搜索量。

就比如今天搜索汽車的用戶最多,那麽汽車的評分可能就是10分,這個時候,算法會分配更多的資源到汽車相關的信息上去,去抓取更多的優質網頁。

這裏有四個好處,提升信息反饋速度、增加熱點反饋的時效性、節約計算機資源以及圍繞最終目的,讓更多使用我們搜索引擎的用戶得到有用信息。

第三,用戶反饋機制,也就是跟蹤用戶的點擊情況和瀏覽情況。

還是用汽車舉例,有100個用戶搜索汽車後,80個點擊了A網頁,A網頁的評級就會上升,如果有更多的用戶在A網頁的停留時間較長,A網頁的評級也會上升,如果有更多的用戶在A網頁上直接進行鏈接等操作,A網頁的評級也會上升。

也就是說,在整個網頁評級系統中,加入用戶反饋分。

第四,規律算法,在用戶的所有行為中尋找大概率行為,並將這些大概率反饋到人工,比如說60%搜索了汽車的用戶下一個搜索詞都是保險。

這樣的一些規律我們是無法預測的,但我們可以利用算法進行大數據挖掘,回饋的這些結果可以供人工分析部對一定的網頁進行評分,這個就是人工分。

結合以上四點,在我的算法下,任何一個網頁同樣會有一個分數,我稱其為精度分。

影響精度分的因子包括自己評分,鏈接的垂直網站評分,用戶反饋分,人工制定分以及外鏈影響等。”

之後,孟謙淺嘗輒止的展示了各個分支的算法邏輯和算法推演公式。

然而就在孟謙在說最後一個規律算法的過程中,來自IBM的傑爾夫突然起身驚呼,“OH MY GAD!Artificial Intelligence?!”

孟謙轉過頭看了一眼對方,皺了皺眉。

傑爾夫頓了頓,以為孟謙是沒聽懂,用奇怪的發音道,“臥槽!!!”

……

而隨著傑爾夫的打斷,原本都沉浸在孟謙分享中的其他四名技術人員,眼神也都出現了明顯的變化……