百度內部核心算法信任值與推薦度分析!

前面我講過在SEO結構排序當中,搜索引擎制定的每一個搜索因子都有對應的算法可循,本篇文章是某百度內部人士所公布了一個文檔,關于全面分析搜索引擎網頁評級分析以及推薦度算法講解。從本質上把網頁評級的每一個細節和參數,包括維度進行歸類和分析,為SEO人在理解百度權重的同時起到幫助。
一、站點預處理:預處理中的系數,涉及到初始值,這個每個網站都一樣,只是在后面的減分中會產生差距。所以,前45天的認真程度,會很長時間關系到這個網站在百度中的好壞。
二、百度權重:分值為20個檔。0-19,只是這個權重不參與排名計算。這個權重值影響其他系數的變動。推薦值,信任值。比如,權重19的網站信任值積累速度肯定比權重18的快。賦予的信任值衰減度也肯定低一些。百度考慮放出權重值供大家查詢,應該在七月份之后。
三、推薦度:推薦度的理解,就是以前老版本的權重。換鏈接的時候,都會考慮這個鏈接會不會傳遞權重,其實這個東西就是推薦度。具體數值為1,2,3,具體數值代表的意義不詳,只知道是類別的區分。公式為周期衰減型的微積分公式,簡單的表格統計幾次計算(單位傳遞值1000,只統計小數點后四位)。為了計算方便,傳遞值默認為一千,實際每次傳遞值默認數值都不一樣,和權重有最直接的關系,最高和最低相差懸殊幾百倍都有可能,公式為著名的金字塔模型公式(也叫能量金字塔)。我就不去計算了,百度沒有做任何修改,或者有修改沒公開出來。
所以,根據滯留算法中相關所得,做外鏈,做第二層級的外鏈性價比最高。一個外鏈,最多傳遞五個層級下去,當然,這里計算的是每個層級中的網站,都只有一個對外鏈接,就是說,第二層級,只有一個第三層級的鏈接。如果有五個,那么推薦值要平均除以5的。第二周期大致為第一周期的百分之三十,第三周期大致為第一周期的百分之五。周期為兩種(自然天數四十五天,就是說,第一周期45天結束之后,自動進入第二周期)
前一周期推薦值溢出,自動進入第二周期。具體推薦值多少溢出,和網站權重有關,權重越高,推薦值上限越高,就跟游戲等級的當前經驗值。只不過,推薦度滿了不會升級。推薦值溢出之后剩余多少進入下個周期計算,和信任度有關前一周期結束,當前積累的推薦值計算之后,會并入第二周期中計算。這個公式有五個,太難算,且沒有實際應用價值,就沒有去算。這個每次并非遞減,而是遞增了。
推薦度激活:也叫外鏈激活,百度識別鏈接之后,在統計處理(統計當前網站和鏈接網站相關)之后,會自動激活推薦度的傳遞,激活之后,蜘蛛每爬取一次,都會傳遞一次,一個鏈接,最多傳遞199次。或者用戶通過百度進入當前頁面點擊這個鏈接,也會激活推薦度。這個一般在當前鏈接已經失去傳遞推薦度之后,可以這樣激活一次,重新進入傳遞的過程。(百度認為,你發的外鏈沒人點,那就是浪費。會在今后的更新中,識別這種點擊行為,并統計到推薦度傳遞值中。暫時沒有生效。)
四、傳遞值和推薦度的關系:兩者實際沒有直接的換算關系,推薦度的數值,1,2,3只是類型的分類,而推薦值是具體的分值,是加分制和衰減制的,和推薦度的1,2還是3,都沒有最直接的關系,今后會有相關的更新,暫時沒有消息。
五、推薦傳遞的規則:類聚和群集,并非所有鏈接都會產生推薦值傳遞行為。
六、推薦值對排名的影響:網站吸收過來的被推薦值數值是變動的,這個數值并不會因為有鏈接的導出而減少。導出多少和這個推薦值沒有任何關系。變動的被推薦數值在預處理中占有很大的比重。但是在系數處理中,推薦值所能體現的作用很小,被縮小的十倍左右(公式中體現,百度使用了重力系數g=9.8)
七、推薦度的生效時間:約18天左右。也就是說,一個有推薦度的鏈接,給別人的推薦值雖然傳遞過去了,但是對方要生效,并進入計算,計算后并調整結果,需要18時間。這之間主要是過濾垃圾鏈接,百度過濾鏈接的算法不是一直執行的,是周期性執行。
八、推薦值:推薦值溢出時,會給網站增加一個單位的信任值。和推薦值不同,信任值得數值都很小,一天增加個0.1就算一個很大的數值了。推薦度能一定程度上提升網站信任度的信任值的變化,在以前,幾乎是一比一的關系,到了第三代算法環境時候,百度就大大降低了這個變化。
九、信任值:信任值更多的是綠蘿算法給予的判定標準,主要是網站質量。信任值本身不參與排名計算,但是會最直接的影響網站的穩定和觀察停滯最大時間。網站降權了,有信任值的也不會恢復,需要有狀態爬蟲的訪問,才能解除降權。信任值網站能提高狀態爬蟲的訪問周期(不然半年一次)降權的最后審核,也是這個爬蟲的作用。簡單的理解為數值前面加個負號。
十、信任值怎么來:和收錄量,收錄衰減率兩者有關系。
十一、收錄量:site值為準,site沒有的,不代表沒有收錄,收錄了沒有放出來,為啥沒有放出來呢,是因為當前頁面存在異常,一般都是關鍵詞異常,頁面打開異常。信任值高的時候,會直接放出來,以后發現問題,會刪掉。信任值不高,就會等過濾完,符合就放,不符合就不放。這里有很多過濾機制,嚴重的會永遠不放,但是不會影響網站其他頁面,也只是對當前頁面生效。同樣的,放出一個頁面,也對排名沒啥變化,只能提升一下信任值。
十二、信任值對網站的作用:
1、網站作弊處理輕重(點擊也屬于作弊)
2、內頁收錄和內頁預排名
3、推薦值周期溢出剩余值
4、詞庫的多少(這一條對新聞源不生效)
5、信任值影響網站圖片收錄和排名(圖片排名還和alt有關)
信任值的高低,直接影響詞庫的多少,有些網站,做的很好,但是內頁幾乎都沒有什么好排名,長尾詞建設的很困難。這個時候就需要信任值分流來操作,降低首頁關鍵詞排名,提升內頁關鍵詞排名。這個過程不可逆轉,因為信任值屬于消耗品。