搜索引擎蜘蛛程序在爬行網(wǎng)頁的時候,為了節(jié)約服務(wù)器資源,保證高效的運行效率,他可能會忽略掉網(wǎng)頁中一些內(nèi)容,我們盡量要避免蜘蛛程序忽略掉網(wǎng)頁的重要內(nèi)容,為了更好的進(jìn)行SEO工作,你可能需要對網(wǎng)頁進(jìn)行一些必要的改進(jìn)。
一、精簡網(wǎng)頁
蜘蛛程序不太喜歡爬行太過于臃腫的網(wǎng)頁,為了保持自身的高效率運行,蜘蛛程序花同樣的時間可能會爬取更多精簡的網(wǎng)頁,每個蜘蛛程序都有自己的限制程序,太大的網(wǎng)頁可能會導(dǎo)致不能完全爬行,甚至根本不去爬行這些網(wǎng)頁。
當(dāng)然,目前使用
布局的已經(jīng)很少,一般情況下,導(dǎo)致網(wǎng)頁體積變大的原因都是由于JS代碼太多引起的,要解決這樣的問題,應(yīng)該把JS代碼從網(wǎng)頁轉(zhuǎn)移到一個外部JS文件,這樣蜘蛛程序?qū)⒉粫ヅ佬兴?,而且網(wǎng)頁界面不受任何影響,從而達(dá)到精簡網(wǎng)頁的目的。
二、驗證HTML的正確性
當(dāng)用戶在瀏覽我們網(wǎng)頁的時候,可能很少看見錯誤信息,這樣看起來網(wǎng)頁的HTML好像沒有什么問題,但目前的瀏覽器,特別是IE瀏覽器,其設(shè)計的思想高質(zhì)量的顯示網(wǎng)頁,盡量不讓用戶發(fā)現(xiàn)網(wǎng)頁上的問題,因此,瀏覽器是可能容忍HTML編碼錯誤的。但是,作為進(jìn)行SEO優(yōu)化的網(wǎng)頁,面對的不僅僅是用戶,還有蜘蛛程序,蜘蛛程序不想瀏覽器那樣,任何錯誤的編碼都可能會向蜘蛛程序提供錯誤的信息。
由于目前很多個人站長都采用CMS程序來建站,在編輯模板文件和購買模板的時候,一定要注意起HTML代碼的正確性,大多錯誤都發(fā)生在標(biāo)簽的寫法上,比如最近一個客戶的網(wǎng)頁統(tǒng)計代碼未封口,在網(wǎng)站上線前或者注意到問題的時候,可以用檢測工具(www.w3.org)檢查下網(wǎng)頁代碼是否正確,避免這些小失誤有助于蜘蛛程序更好的讀取數(shù)據(jù)網(wǎng)頁數(shù)據(jù)。
三、FLASH中避免包含重要鏈接信息
FLASH網(wǎng)站的確比常規(guī)的HTML更吸引用戶眼球,其用戶體驗自然也好的多,但是搜素引擎并不能想用戶一樣去瀏覽FLASH,無法確定FLASH里面包含的內(nèi)容,而存在與FLASH里面的重要鏈接信息(比如導(dǎo)航)也自然不會被蜘蛛程序捕捉到(谷歌貌似能讀懂FLASH)。這里也并不是說網(wǎng)頁中就一定不能使用FLASH,因為FLASH對提升用戶體驗的效果我們是肯定,那么,我們只要盡量保證FLASH中內(nèi)容不會包含重要的鏈接信息。
四、避免使用FRAMES框架
由于蜘蛛程序會話費很多時間來解讀基于frames框架的網(wǎng)頁,使得目前搜索引擎開始考慮放棄蜘蛛程序?qū)?span lang="EN-US">frames內(nèi)容的爬行,這在百度SEO指南中有明確說明,對于使用frames的網(wǎng)頁,可以借助noframes標(biāo)簽將框架中的重要內(nèi)容提取出來,這樣有助于蜘蛛程序了解框架結(jié)構(gòu)中的重要內(nèi)容。