姓名
手機
隨著互聯網的快速發展,越來越多的年輕人開始了網絡創業,每天都有數以萬計的新網站上線,同時也有數以千萬計甚至億計的新網頁產生。隨著網絡的普及,互聯網進入家庭,越來越多的人開始通過互聯網獲得信息,潛在客戶通過互聯網尋找自己需要的產品信息,商家通過互聯網接觸到潛在客戶達成交易。面對龐大的網頁信息數據,搜索引擎要處理這樣一個數量級的網頁信息,進行搜索排序,可謂是歷盡艱辛。
很多商家和個人站長為了通過網站獲得客戶和收益,也就需要提高自身網站在搜索結果里面的排名,從而提高網站與潛在客戶接觸的機會,于是研究如何才能快速提高網站在搜索結果的排名就成了一些人必須要做的事,SEO行業產生了。
在中國,百度是人們最常使用的搜索引擎,研究百度排名算法,成了眾多SEOer工作者必須要做的事情,隨著這兩年百度算法的不斷調整,越來越多做SEO的人感覺到SEO越來越難做了,以前做SEO很簡單,多增加一些網站內容,多交換些友情鏈接,發些外鏈,網站排名就上去了,而現在百度算法的每一次調整,都會有一大批的網站在搜索結果中消失,甚至搜索網站全稱都找不到。有經驗的站長就發現,百度現在對網站內容的原創性越來越重視。
之前也有人總結過百度判斷網站內容原創性的標準,不過都不完善,今天有幸在百度站長平臺看到百度官方公布的百度判斷網站內容原創的一個算法——原創識別“起源”算法,原文如下:
互聯網動輒上百億、上千億的網頁,從中挖掘原創內容,可以說是大海撈針,千頭萬緒。我們的原創識別系統,在百度大數據的云計算平臺上開展,能夠快速實現對全部中文互聯網網頁的重復聚合和鏈接指向關系分析。首先,通過內容相似程度來聚合采集和原創,將相似網頁聚合在一起作為原創識別的候選集合;其次,對原創候選集合,通過作者、發布時間、鏈接指向、用戶評論、作者和站點的歷史原創情況、轉發軌跡等上百種因素來識別判斷出原創網頁;最后,通過價值分析系統判斷該原創內容的價值高低進而適當的指導最終排序。
目前,通過我們的實驗以及真實線上數據,“起源”算法已經取得了一定的進展,在新聞、資訊等領域解決了絕大部分問題。當然,其他領域還有更多的原創問題等待“起源”去解決,我們堅定的走著。
以上是百度識別原創內容的“起源”算法的描述,與這些內容相關的還有一些描述,關于優質原創內容的說法,利用自動文章生成器等工具,“獨創”一篇文章,然后安一個吸引眼球的title,現在的成本也低得很,而且一定具有獨創性。然而,原創是要具有社會共識價值的,而不是胡亂制造一篇根本不通的垃圾就能算做有價值的優質原創內容。內容雖然獨特,但是不具社會共識價值,此類偽原創是搜索引擎需要重點識別出來并予以打擊的。
雖然只有短短的幾行字,但足以給我們這些SEOer很大的啟發,給了我們原創的方向,做SEO做的就是細節,不僅僅為了獲得排名,為用戶提供有價值的東西才是SEOer真正應該努力的方向。搜索引擎不排斥SEO,但也不接受為了獲得排名鉆排名算法漏洞的SEO做法。
下面來總結一下百度判斷原創的幾個基本標準:
1、內容的獨特性
2、作者
3、發布時間
4、鏈接指向
5、用戶評論
6、作者和站點的歷史原創情況
7、轉發軌跡
8、社會價值
以上這些只是在這次文章中例舉出來的,還有很多判斷細節的標準有待研究,希望對廣大站長有用,也希望站長們多研究,研究出更多百度判斷原創的標準,以幫助提升SEO的效率。
本文版權歸通王科技所有,可任意轉載,轉載請注明作者和出處!
本文首發:www.hkmilson.cn