因為那時尚未接觸到站長網這樣的專業型網站,所以根本不了解SEO,只知道一味地用稿件的數量換取訪問量。于是在建站之初,每天除了真正有自己原創的稿件之外,還從其他網站上面直接未加修改復制采集了許多稿件。很快,谷歌收錄量達到三四千以上,而騰訊SOSO新聞業把我的站點納入新聞來源。而為了滿足騰訊soso新聞,我們不得不進行更多新聞稿件的采集,于是網站上面復制的稿件越來越多。
起初我并沒有覺得這樣做有什么不好,還覺得自己每天忙得不亦樂乎。直到有天晚上,網站上面一個友情鏈接的網站站長突然以我們網站被百度K掉為由說要刪掉鏈接。我這才發現一個奇怪的現象,谷歌收錄近5000,百度收錄卻是0。我開始尋找各種原因和解決的辦法,在站長網這類網站上面學到了許多網站建設方面的知識。原來大量的復制采集是導致網站不被百度收錄的禍根之源。
此外,由于之前網站域名是被服務商禁用了,沒有進行301重定向,所以長期以來百度還是“信任”原來的舊域名,對我們更換的新域名遲遲不肯接受。
后來我不斷地尋找自己的原因,可是百度就是不收錄我的站點。也給百度投訴過關于快照的問題,百度的答復依舊是這樣:
尊敬的用戶,您好!
百度使用自動的spider程序抓取互聯網上的網頁,大多數情況下,網站都能被百度自動收錄。雖然百度希望盡可能多的抓取互聯網上的網頁,但為了確保用戶的搜索體驗以及某些不確定的原因,仍會有少數網站無法被百度收錄,如果您的網站未被收錄,通常是由以下原因引起的:
1. 您的網站所在服務器不穩定,被百度暫時性去除,穩定之后,問題會得到解決。
2. 您的網站有設計缺陷,導致spider無法正常抓取。
3. 您的網頁不符合用戶的搜索體驗。
4. 網頁是復制自互聯網上的高度重復性的內容。
5. 網頁做了很多針對搜索引擎而非用戶的處理,使得用戶從搜索結果中看到的內容與頁面實際內容完全不同,或者使得網頁在搜索結果中獲得了不恰當的排名,從而導致用戶產生受欺騙感覺。
6. 您的網頁內容有不符合國家法律和法規規定的地方。
7. 您網站的robots協議禁止百度抓取。
8. 其他技術性問題。