搜尋引擎*化(又稱搜索引擎優(yōu)化, 其英文叫 Search Engine Optimization,簡稱SEO)是一種利用搜索引擎的搜索規(guī)則來提高目的網(wǎng)站在有關搜索引擎內(nèi)的提名的方式。由于不少研究發(fā)現(xiàn),搜索引擎的用戶往往只會留意搜索結果最開首的幾項條目,所以不少網(wǎng)站都希望透過各種形式來影響搜索引擊的排序。當中尤以各種依靠廣告維生的網(wǎng)站為甚。
所謂“針對搜尋引擎作*化的處理”,是指為了要讓網(wǎng)站更容易被搜尋引擎接受。搜尋引擎會將網(wǎng)站彼此間的內(nèi)容做一些相關性的資料比對,然后再由瀏覽器將這些內(nèi)容以最快速且接近最完整的方式,呈現(xiàn)給搜尋者。
搜索引擎優(yōu)化對于任何一家網(wǎng)站來說,要想在網(wǎng)站推廣中取得成功,搜索引擎優(yōu)化都是至為關鍵的一項任務。同時,隨著搜索引擎不斷變換它們的排名算法規(guī)則,每次算法上的改變都會讓一些排名很好的網(wǎng)站在一夜之間名落孫山,而失去排名的直接后果就是失去了網(wǎng)站固有的可觀訪問量。所以每次搜索引擎算法的改變都會在網(wǎng)站之中引起不小的騷動和焦慮??梢哉f,搜索引擎優(yōu)化是一個愈來愈復雜的任務。
早期搜尋引擎
網(wǎng)站管理員以及網(wǎng)絡內(nèi)容提供者在90年代中期開始使用搜尋引擎來優(yōu)化網(wǎng)站。此時第一代搜尋引擎開始對因特網(wǎng)分門別類。一開始,所有網(wǎng)站員得做的事只有提交所屬網(wǎng)站到各家搜尋引擎。這些引擎跑一些蜘蛛機器人(spider)──擷取于網(wǎng)頁程式中找到連至其他網(wǎng)頁的連結──并且儲存所找到的資料。過程中同時包含了將網(wǎng)頁下載并儲存至搜尋引擎擁有者的服務器中,這時有另外一個軟件稱為Indexer來擷取頁面中不同的資訊頁面中的文字、文字的位置、文字的重要性以及頁面所包含的任何連結,之后將頁面置入清單中等待過些時日后,再來擷取一次。隨著線上文件數(shù)目日積月累,越來越多網(wǎng)站員意識到基本搜尋 (organic search,亦翻為隨機搜尋[1]) 條目的重要性,所以較普及的搜尋引擎公司開始整理他們的列表,以顯示根據(jù)最洽當適合的網(wǎng)頁為優(yōu)先。搜尋引擎與網(wǎng)站員的戰(zhàn)爭就此開始,并延續(xù)至今。
一開始搜尋引擎是被網(wǎng)站管理員本身牽著走的。早期版本的搜尋算法有賴于網(wǎng)站員提供資訊,如關鍵字的基本定義標簽(meta tag)。當某些網(wǎng)站員開始濫用標簽,造成該網(wǎng)頁排名與連結無關時,搜尋引擎開始舍棄標簽并發(fā)展更復雜的排名算法。由于數(shù)繁不及備載,僅列舉數(shù)個分析目標如下:
在標題簽里的文字,如:引擎 域名,如:Wikipedia.org 統(tǒng)一資源定位符下屬的目錄與檔名,如:http://Blog.Myspace.cn******** 關鍵字密度 關鍵字接近度,如:'軟盤、軟碟' '硬盤、硬盤' 圖形連結的Alt屬性,如: 由于這些都還在網(wǎng)站員的眼皮下打滾,搜尋引擎陸陸續(xù)續(xù)碰到諸多濫用與操縱排名等難題。為了要提供較好的結果給使用者,搜尋引擎必須調(diào)適到讓他們的搜索結果表現(xiàn)出最適當?shù)慕Y果,而非某些不道德的網(wǎng)絡員產(chǎn)生的、只有塞滿關鍵字的無用網(wǎng)頁。由此,新種類的搜尋引擎應運而生。
當代搜尋引擎
Google 由兩名在斯坦福大學的博士生佩吉 (Larry Page) 和布林 (Sergey Brin) 開始。他們帶來了一個給網(wǎng)頁評估的新概念。這個概念, 稱網(wǎng)頁級別 (PageRank), 是從Google 算法[2]重要的開端 。網(wǎng)頁級別十分倚賴導入鏈結 (incoming link) ,并利用這種每個導入某網(wǎng)頁的鏈結相當于給該網(wǎng)頁價值投一票的理論建立起邏輯系統(tǒng)。越多導入鏈結意味著該網(wǎng)頁越有“價值”。而每個導入鏈結本身價值直接根據(jù)該鏈結從何而來的網(wǎng)頁級別,以及相反的該頁導出鏈結 (Outgoing link) 。
在網(wǎng)頁級別幫助下,Google 在服務相關的結果上證明它相當優(yōu)異。Google 成為了最普遍和最成功的搜索引擎。由于網(wǎng)頁級別度量了站點外因子, Google 感到它會比頁內(nèi)因子難以動手腳。
然而道高一尺魔高一丈。網(wǎng)站員們已經(jīng)開發(fā)出對付Inktomi 搜索引擎的鏈結操作工具和計劃。這些方法證明對Google 算法一樣管用。許多站集中于交換、買賣大量鏈接。隨著‘網(wǎng)站員尋求獲取鏈結只單單要影響Google送更多流量給該站,而不管是否對站點訪客有用否’這種行為增加,網(wǎng)頁級別對原始算法的信賴度漸漸被破壞了。
此時,是Google 和其它查尋引擎對廣大范圍的站外因子仔細檢視的時候。開發(fā)更加聰明的算法有其他原因。因特網(wǎng)已經(jīng)膨脹到擁有非技術的廣大族群。他們經(jīng)常無法使用先進的提問技術來取得資訊;而且他們得面對比起發(fā)展早期更龐大資料、更復雜的索引。搜尋引擎必須開發(fā)具備預測性、語義性、語言性和啟發(fā)性算法。
目前,網(wǎng)頁級別的縮小版仍然被顯示在Google 工具條上,不過網(wǎng)頁級別只不過是Google考慮在網(wǎng)頁分級時超過100個因素里中的一個。
今天,大多數(shù)搜尋引擎對它們的如何評等的算法保持秘密。搜索引擎也許使用上百因素在排列目錄;每個因素本身和因素所占比重可能不斷的在改變。
大部分當代搜尋引擎優(yōu)化的思路──哪些有效、哪些沒效──這些很大部分在于觀察與根據(jù)內(nèi)線消息來的猜測。某些優(yōu)化員得執(zhí)行控制下的實驗以取得不同優(yōu)化方法的結果。
盡管如此,以下是搜尋引擎發(fā)展它們算法時的一些考慮,另,這份Google 專利清單[3]也許讀者可猜出他們會走哪條路線:
站點的年齡 自該網(wǎng)域注冊后過多久 內(nèi)容的年齡 新內(nèi)容增加的規(guī)律性 鏈接的年齡,連接站點的名譽和其相關程度 一般站內(nèi)因素 負面站內(nèi)因素 (例如,太多關鍵字匯標(meta tag),很顯然被優(yōu)化過,會對站點造成傷害) 內(nèi)容的獨特性 使用于內(nèi)容的相關術語 (搜尋引擎關聯(lián)到的術語的方式視同如何關聯(lián)到網(wǎng)頁的主要內(nèi)容) Google網(wǎng)頁級別 (只被使用在Google 的算法) 外在鏈接、外部鏈接的鏈結文字、在那些和在站點/網(wǎng)頁包含的那些鏈接 引證和研究來源(表明內(nèi)容是研究性質) 在搜索引擎數(shù)據(jù)庫里列舉的詞根與其相關的術語(如 Finance/Financing) 導入的逆向鏈結,以及該鏈結的文字 一些導入鏈結的負面計分 (或許那些來自低價值頁、被交換的逆向鏈結等) 逆向鏈結取得速率:太多太快意味著“不自然”的鏈結購買活動 圍繞在導出鏈結、導入的逆向鏈結周圍的文字。例如一個鏈結如果被 "Sponsored Links" (贊助商連結)包圍,該鏈結可能會被忽略。 用 "rel=nofollow" 建議搜尋引擎忽略該鏈接 在站點該文件的結構深度 從其他資源收集的網(wǎng)格表,譬如監(jiān)視當搜尋結果導引用戶到某頁后,用戶有多頻繁按瀏覽器的返回鈕 從來源像:Google AdWords/AdSense、Google 工具條等程序收集的網(wǎng)格表 從第三方資料分享協(xié)議收集的網(wǎng)格資料 (譬如監(jiān)測站點流量的統(tǒng)計程式提供商) 刪除導入鏈結的速率 使用子網(wǎng)域、在子網(wǎng)使用關鍵字和內(nèi)容質量等等,以及從這些活動來的負面計分 和主文件語意上的連結 文件增加或改動的速率 主機服務商 IP 和該 IP 旗下其它站點的數(shù)量/質量
其他鏈結站會員 (link farm / link affiliation) 與被鏈結的站 (他們分享IP嗎? 有一個共同的郵遞地址在"聯(lián)絡我們 (Contact Us)" 頁嗎?) 技術細節(jié)像利用301重定向被移除的網(wǎng)頁、對不存在網(wǎng)頁顯示404服務器標頭而非200服務器標頭、適當?shù)睦?robots.txt 主機服務商正常運行時間 是否站點對不同類的用戶顯示不同的內(nèi)容 (掩飾 (cloaking)) 未及時矯正、無效的導出的鏈結 不安全或非法內(nèi)容 HTML代碼品質,以及錯誤出現(xiàn)數(shù) 由搜尋引擎自他們搜尋結果觀察到的實際點擊通過率評等 由最常存取搜尋結果的人手動評等
搜尋引擎優(yōu)化和搜尋引擎之間關系
在第一代搜尋引擎發(fā)表后,搜尋引擎操作員變得對搜尋引擎優(yōu)化社區(qū)感興趣。在一些早期搜尋引擎, 譬如INFOSEEK, 要得到第一名不過是把*的網(wǎng)頁代碼抓下、放在您的網(wǎng)站、并提交個URL讓搜尋引擎立即索引并排名該頁這么簡單。
由于搜尋本身的高價值和標定性,搜尋引擎和搜尋引擎優(yōu)化員間自始便存在對抗的關系。最近一次于2005 年召開的AirWeb年會,旨在談論縮小這種敵對關系差距,和如何最小化某些太過于侵略性優(yōu)化造成的損壞效果。
某些更具侵略性的優(yōu)化員產(chǎn)生自動化的站點,或者使用某些最終會讓該網(wǎng)域被搜尋引擎掃地出門的技術。而大多數(shù)優(yōu)化公司則銷售長期、低風險的策略服務,而且大部分使用高風險戰(zhàn)略的優(yōu)化公司,則在他們旗下的會員點使用、產(chǎn)生商業(yè)線索、或者純內(nèi)容站點,而非讓它們客戶站親身涉險。
這里提供一個使用侵略性優(yōu)化技術的優(yōu)化公司讓他們客戶被取締的案例。華爾街時報描述了某個使用高風險技術和涉嫌沒有透露客戶得承擔那些風險的公司[4]。Wired報告了該公司起訴某部落格,因為提及該公司被取締[5]。Google 的克特斯 (Matt Cutts) 稍后確認Google 確實取締了Traffic Power以其他們的客戶群[6]。
某些搜尋引擎對搜尋引擎優(yōu)化產(chǎn)業(yè)提供了援助,而且是常常是優(yōu)化會議和研討會的贊助商和來訪貴賓。實際上,自從付費收錄 (paid inclusion) 降臨,一些搜尋引擎現(xiàn)在在網(wǎng)站優(yōu)化社區(qū)的健康有了既得利益。所有主要搜尋引擎都提供資訊/指南以協(xié)助站點優(yōu)化: Google[7] 、Yahoo [8], 和MSN[9]。Google提供了Sitemaps 程序[10]幫助網(wǎng)站員學習如果Google 有任何問題檢索他們的網(wǎng)站時該如何做,并且提供Google流量與您網(wǎng)站關系間無價的豐富資料。雅虎的SiteExplorer[11],旨在提供一個免費方式遞交您的URL, 該方法能讓你決定打算讓雅虎索引多少頁、索引多深。雅虎的Ambassador Program[12] 與Google的Advertising Professionals[13] 提供專家級的認證。
轉載:http://www.nywlwx.com/zixun_detail/3546.html