‹‹ 上一主題 打印 下一主題 ›› 面對搜尋引擎的網站設計【下集】

 

palada

新手上路
Rank: 1

發表於 2008-12-2 15:49 | 1# TOP 只看該作者

面對搜尋引擎的網站設計【下集】


如何突出關鍵詞:面向主題(Theme)的關鍵詞匹配

Theme Engine正在逐步超過PR,成為結果排序中更主要的因素,可以比較一下以下現象:
為什麼查「新聞」,「汽車」之類的文字,各種門戶網站的首頁不在第一位?



要知道他們的頁面中都有相應頻道的連結文字的一篇新聞頁面中,搜尋引擎如何不通過模板匹配,自動將新聞的主體和頁面中的頁頭,欄目導航條,頁尾等部分的內容區分開的?


其實以上問題都可以歸結為網頁內容摘要的提取策略和關鍵詞在其中的命中。首先將能夠描述一個頁面內容的分成以下幾種類型:連 入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

HTML頁面標題:title 好標題一般會將頁面中最重要的關鍵詞放在最前面,比如:ABC-10型吸塵器 - XX家電城,HTML內容主體:content text,連 出文字:outbound link text


如果按照以下規則:

一個頁面中關鍵詞命中權重:連 入文字 > HTML標題文字 > HTML頁面主體內容 >> 出連 文字,以上現象就比較好解釋了。
連 入文字是頁面上看不見的,但連 入文字對被連結頁面有巨大的作用:在現代搜尋引擎在關鍵詞匹配的過程中,匹配的過程不只看當前頁面的內容摘要:很大程度上,不只看這個網頁自己說自己有什麼內容,還要看別人如何連結時,如何描述你的網站別人怎麼稱呼你,比你自己說自己更重要。比如查:「世界衛生組織」。


返回結果中有 http://www.who.int/ 而這個頁面中是沒有中文的,之所以能匹配上,是因為很多連結它的中文網站使用了:世界衛生組織,所以,這個頁面中不存在的中文關鍵詞也成為了頁面摘要的一部分。這樣一想,就可以知道連 出連結的文字其實是為被連結的子頻道首頁或者內容詳情頁服務的。


對自身頁面的關鍵詞密度只有負面的影響,這也是Google建議一個頁面中連結不要超過100個的原因:他根本不索引100個連結以後的內容。


按照以上規則,搜尋引擎將一篇新聞詳情頁中的新聞內容提取出來就是把頁面上所有帶HTTP連結的文字都去掉,就是新聞的內容部分了。


更精確一些可以通過取最長文本段落等策略實現;而很多網站首頁或頻道首頁中幾乎全部都是連結,經過搜尋引擎分析的結果就是:什麼內容也沒有,能夠被命中的關鍵詞僅僅是別人連結你用的「網站首頁」和頻道標題Title中的站點名稱等的幾個關鍵詞,而頁面中其他的文字則遠遠不如相應子頻道和具體內容頁面的匹配度高,而搜尋引擎能夠通過以上規則,讓用戶更快的直接定位到有具體內容的內容詳情頁面。


因此希望通過一個首頁,盡可能多的命中所有希望推廣的關鍵詞是不可能的。讓網頁盡可能多的進入搜尋引擎的索引,然後把握好整個網站的主題風格是非常重要的,讓網站的主題關鍵詞能夠比較均勻的按照金字塔模式分佈到網站中可以參考:


網站的主題金字塔設計
網站名稱(用戶通過1-2個抽像關鍵詞)
/
子頻道1 子頻道2 (用戶通過2-3個關鍵詞命中)
/ /
產品1 產品2 文章1 文章2 (用戶通過3-4個關鍵詞命中:這種用戶最有價值)



不要空著標題:空著無異於浪費了最有價值的一塊陣地;傳統的頁面中,HTML頁面中會有類似以下的隱含信息,用於說明當前網頁的主要內容關鍵字:後來由於這種人工添加關鍵詞的方式被濫用,大量網頁中為了提高被搜尋引擎命中的概率,經常添加一些和實際網頁內容無關的熱門關鍵比如:「music mp3 download」等,所以新一代的搜尋引擎已經不再關心頁面頭文件中的人工meta keyword聲明,而頁面標題在搜尋引擎的關鍵詞的命中命中過程中往往有著更高的比重,如果一個關鍵詞在標題中命中會比在頁面中命中有更高的得分,從而在相應的搜索結果排名中更靠前。

標題長度和內容:不要過長,一般在40個字符以內,並充分突出關鍵詞的比重;如果更長的標題搜尋引擎一般會忽略掉,所以要盡可能將主要關鍵詞放在標題靠前的位置。省略掉不必要的形容詞吧,畢竟用戶主要通過名詞來找到需要的內容。


標題內容:盡量用一些別人可以通過關鍵詞找到的字眼(也別太過頭,如果標題中的字眼超過一半內容中都沒有,有可能被搜尋引擎排除出索引),因此基於web日誌中來自其他搜尋引擎的關鍵詞查詢統計非常必要。如果網頁很多的話,盡量使用不同的網頁標題,爭取讓自己網站的內容更多的進入搜尋引擎索引範圍;因為搜尋引擎會根據頁面內容的相似度把一些內容當成重複頁面排除出索引範圍。

http://www.chedong.com/phpMan.php 是我的網站上的一個小應用:一個web界面的unix命令手冊(man page),在以前的設計中所有動態頁面使用的都是同樣的標題:"phpMan: man page /perldoc /info page web interface」 ,Google索引了大約3000多個頁面,後來我將頁面標題改成了"phpMan: [命令名]"這樣的格式,比如:"phpMan: ls",這樣大部分動態頁面的標題就都不一樣了,一個月後Google從這個頁面入口索引了大約6000個頁面。



因此,如果網站中很多網頁都使用相同的標題,比如:「新聞頻道」,「論壇」,這些頁面中很大一部分就會被排重機制忽略掉。

文章原創:拍樂得數位行銷有限公司
本公司專精於網路行銷、關鍵字seo、seo優化教學顧問服務、各種應用軟體的設計開發
有需要的朋友,洽詢電話:02-2368-8183 0966-350-390 麥克先生
MSN:palada168@yahoo.com.tw
e-mail:palada168@yahoo.com.tw