熱門搜索: 杭州SEO SEO 網站優化 網站推廣 百度快排 整站優化 SEO培訓 快速排名 搜索引擎優化 SEO教程 關鍵字排名 關鍵詞優化 SEO視角

SEO_SEO優化_SEO培訓_杭州SEO

您的位置:杭州SEO > SEO百科 > 正文
欄目:SEO百科 本頁標簽:倒排索引

解密百度索引之正向索引和倒排索引

日期:2018/6/18 20:59:27 來源:杭州SEO 人氣:

索引是什么?

百度一邊要從網絡抓取海量的信息存入數據庫,一邊要在大家搜索的時候,把信息數據對應到關鍵詞,按照一定 順序釋放出來,這中間就是靠索引來完成的。

湖北seo|解密百度索引之正向索引和倒排索引

索引分正向索引和倒排索引

索引就是關鍵詞與網頁文件之間的一種對應關系。所以就存在兩種索引:正向索引和倒排索引。我們知道搜索引擎中使用的是倒排索引,有不少朋友并不理解什么叫倒排索引。這里先來介紹—下正向索引。當用戶進行査詢時,如果對本地文件全面掃描用戶所提交的關鍵詞,"查詢"的工作量就太大了,而且也是很消耗服務器資源的,所以搜索引攀會把已經處理過的網頁先進行索引,放到數據庫中等待網民的搜索査詢請求。

一個網頁被搜索引擎經過以上處理后,就只剩下能夠體現網頁主體內容的文本了,此時就可以對該網頁進行索引了。正向索引指的是文件對應關鍵詞的形式,正向索引數據結構簡化示意如下圖。

湖北seo|解密百度索引之正向索引和倒排索引

如果使用這種索引直接參與排名,則與不分詞沒有太大區別,也需要對所有文件進行檢索,并且如果用戶提交的是長尾詞,這種索引對文件內容相關度的計算也會非常耗費資源。

為了使得索引文件可以直接用于排名,搜索引擎會把上面的對應關系進行轉換,做成倒排索引,也就是采用關鍵詞對應文件的形式。倒排索引的數據結構簡化如下圖。

湖北seo|解密百度索引之正向索引和倒排索引

這樣的索引結構就可以直接應用于搜索排名了,比如,用戶搜索關鍵詞1,那么搜索引擎只會對包含關鍵詞1的文件進行相關度和權重計算;用戶搜索"關鍵詞1+關鍵詞2"組合詞,那么搜索引擎就會把包含關鍵詞1且包含關鍵詞2的文件調出,進行相關度和權重計算。這樣就大大加快了呈現排名的速度。

倒排索引中不僅僅記錄了包含相應關鍵詞文件的ID,還會記錄關鍵詞頻率、每個關鍵詞對應的文檔頻率,以及關鍵詞出現在文件中的位置等信息。在排名過程中,這些信息會被分別進行加權處理,并應用到最終的排名結果中。

在SEO操作中,會有相對應的加大關鍵詞頻率、盡量使核心關鍵詞出現在網頁的最前面, 以及關鍵詞用H標簽和變色加粗等著重標識的操作手法,這些都會被倒排索引所記錄,并參與關鍵詞相關度的計算和搜索排名。

 

您會喜歡的相關文章:

SEO搜索引擎中的正向索引與倒排索引讓你明白關鍵詞排列原理!

秒速时时彩开奖漏洞