Post By:2009/5/13 17:37:01
作為人類對信息控制和管理最普及、最便捷的途徑,搜索引擎的每一個新成果都可能影響整個社會文明進步的進程。它的未來在哪里?我們一直在期待大佬們每一個可能的答案。
最近,在中文互聯(lián)網領域,百度上交了自己的作業(yè)--阿拉丁。之前李彥宏和李一男曾經在多個公開場合提及它,但在發(fā)布時,百度卻變得異常低調。
這個被百度官方稱為“搜索開放平臺”的新東西會是影響搜索未來的big thing么?在過去的幾天里,這是我與業(yè)界朋友聊天的唯一話題,在本文評論之前,我先梳理一下什么是搜索開放平臺本身。
我所理解的搜索開放平臺
“搜索開放平臺”的機制實際上很簡單,站長主動向搜索引擎提交一個個結構化的數(shù)據(jù)模塊,并可設置其展現(xiàn)樣式、關聯(lián)的關鍵詞、更新頻率等,百度予以采納后將這些數(shù)據(jù)直接呈現(xiàn)給用戶。
和傳統(tǒng)的搜索機制,它主要有3點變革:
其一,傳統(tǒng)搜索的展示元為一個個的web,開放平臺將其縮小到了數(shù)據(jù)模塊。這一變革的意義在于信息價值的最大化,同時大幅提升搜索的用戶體驗。
這一點,大家可以百度一下“人民幣匯率”,我粗略估算了一下,應用搜索開放平臺之后,對于關心“人民幣匯率”的用戶,每次檢索,至少可以節(jié)省10秒以上。
其二,搜索由“只讀”變?yōu)椤翱蓪憽。如果說之前的sitemap類協(xié)議讓搜索從“被動”變成“主動”,那么阿拉丁讓搜索引擎本身從“只讀”變成了“可寫”。站長在參與搜索結果本身,將變得越來越主動,而這種主動,是基于非SEO方式下開展的。
其三,搜索結果開始可定制。在開放平臺中,站長將“指定的內容”,在“指定的關鍵詞”匹配下,以“指定的樣式”進行展現(xiàn)。
從本質上來說,這可以理解為:百度與內容網站合作,共同來滿足網民對搜索體驗的更高要求。
搜索開放平臺、Onebox、Subscribed Links、SearchMonkey
看到這個平臺,讓我想起了一大堆搜索創(chuàng)新技術,包括Google的Onebox、Subscribed Links,以及Yahoo的SearchMonkey。
這些新應用的共同之處在于,搜索結果將展示一些更為具體的數(shù)據(jù)模塊,而非傳統(tǒng)的--鏈接,比如在Google onebox技術下,搜索百度的股票“BIDU”可以直接看到實時的盤面信息,在Yahoo的SearchMonkey技術下,一些聲音、視頻節(jié)目可以嵌入到結果中直接播放。
不過它們和搜索開放平臺卻有著很大的區(qū)別--Onebox下搜索結果的展示方式很像阿拉丁,但它是一個封閉的系統(tǒng),主要由Google自身把控,Google再強大,也不可能聰明到重構內容網站的數(shù)據(jù)展示形式,它更多的是對自身網頁數(shù)據(jù)庫內容的直接抓取,且覆蓋領域很小。
從運行機制來看,Subscribed Link和SearchMonkey倒是和搜索開放平臺有點相似--站長提交標準的數(shù)據(jù)模塊,設置匹配的關鍵詞,設計其展示樣式,Google和Yahoo對數(shù)據(jù)進行索引,供用戶直接查詢。但實際卻大不相同:
其一,是否將這些應用展現(xiàn)在搜索結果中,搜索開放平臺是由百度產品人員替用戶來考慮決定的,而Subscribed Link和SearchMonkey是由用戶決定的。Subscribed Link采用的是用戶訂閱的方式,也就是說,只有當你訂閱某個內容網站提交的數(shù)據(jù)模塊時,在搜索相關關鍵詞后才能感受到它的存在。SearchMonkey也類似。
也就是說,百度期望平臺的應用能讓每一個用戶受益,而Google和Yahoo則更在意開放的自由度。我認為,這是“百度更懂中國網民”的又一次體現(xiàn)。如果搜索開放平臺也采用“自由使用”的方式,幾乎可以肯定它將成為雞肋。
其二,搜索開放平臺目前只開放了“確定性”的數(shù)據(jù)源,類似“人民幣匯率”、“NBA賽程”這種。而Subscribed Link和SearchMonkey則甚至開放了圖片、視頻、游戲等眾多內容。
這是百度的又一個聰明之處。顯然,對于一個強推的應用來說,最重要的就是可控性,開放是一把雙刃劍,它可能帶來更精準的搜索結果,也可能帶來一大堆spam。在這一點上,百度極為謹慎,這種謹慎很有必要。
不管是阿拉丁、onebox,還是Subscribed Link、SearchMonkey,本質上都是搜索巨頭們對“Hidden Web”(暗網)的一種應對方案,但大家在處理方式上的不同,將引發(fā)截然不同的效果。
如何評估阿拉丁對中文互聯(lián)網的影響
一切才剛剛開始,現(xiàn)在要評價搜索開放平臺似乎為時尚早,不過它的王侯氣質已經顯現(xiàn)出來。在我看來看,這個平臺將帶來以下變革。
1、搜索體驗革命。Web還是那些Web,它們的內容沒有發(fā)生任何變化,但搜索開放平臺將用戶想要的最終答案呈現(xiàn)出來,這一點,是全體中文網民的福氣。
在韓國的Naver搜索引擎中,輸入“china”你會發(fā)現(xiàn)一個關于中國概況的信息模塊,與百度相比,Naver依賴的是人肉的力量,兩者搜索體驗的提升是異曲同工的。
2、搜索引擎與內容網站的關系將重構。在互聯(lián)網早期,網站更多來自自然流量,Yahoo和Google的崛起開始讓提供內容的網站對搜索越來越依賴。隨著搜索開放平臺、Subscribed Link、SearchMonkey等新技術的應用,可以想象,針對同一類數(shù)據(jù)的搶奪將不可避免的變得慘烈,在這個過程中,搜索引擎與內容網站之間的關系將變得更加微妙。
3、互聯(lián)網信息的流通正在有序化。對于搜索,傳統(tǒng)的展現(xiàn)方式是以網頁為單位的,百度的搜索開放平臺則讓這種單位縮小到了一個個信息模塊,這些信息模塊的整理和標準化將有助于未來我們對互聯(lián)網信息更深層次的掌控。
總之,阿拉丁的最大受益者是網民,其次是那些在這個變革期間的積極實踐網站,最后才是百度自身。值得提醒的是,一如當年搜索引擎誕生之初就重視SEO的網站,這是一個新的契機。
搜索開放平臺只是“阿拉丁”的“一期工程”
通過開放平臺來解決“暗網”問題,可以理解為一種“迂回”的方式,但是我相信,在百度的整個“阿拉丁”計劃中,這只是一部分。
據(jù)Communications Of the ACM的數(shù)據(jù),目前主流的搜索引擎只覆蓋到了網頁數(shù)據(jù)內容的37%。如何抓取更深層次的網頁,并非一個搜索開放平臺完全能解決的,比如聲音、視頻格式內容,AJAX產生的內容,程序動態(tài)生成的內容,人為限制的內容,等等。
相信在搜索開放平臺之外,百度還在嘗試一些主動的技術。等到將所有關節(jié)都打通的時候,阿拉丁的完整面貌才會展現(xiàn)在我們面前。
從阿拉丁計劃中我們可以得到一個啟示:真正顛覆格局的還是技術上的創(chuàng)新,一旦這些創(chuàng)新打破了各個信息源之間的隔閡,未來的互聯(lián)網將變得更加有意思。
對阿拉丁的一些建議和強調
在我的理解中,阿拉丁計劃成敗,有幾個問題至關重要。
1、對信息源的100%把握
單純論理想,Google Base不可謂不宏大,也不可謂不開放,但如果在中國開放這么一個東西,不可避免成了spam的樂園。
對于阿拉丁,我的建議就是--控制、控制、控制。據(jù)我所知,目前百度對網站提交數(shù)據(jù)的審核非常嚴格,對什么是“確定性數(shù)據(jù)”,百度一定要有一個非常嚴厲的把控。
阿拉丁應該是一個著眼未來的長期計劃,不要急于求成,寧愿這個進程更慢一點,急功近利會害了它。
2、必要的黑名單機制
我留意到在搜索開放平臺的注冊中,引入了實名機制,站長甚至需要提交身份證復印件?梢钥闯觯俣葘檎鹃L建立一個信用的評估機制。
要保證平臺本身的健康,這一點很有必要。從規(guī)則來看,百度對站長提交的信息會進行審核,但并未公布一個黑名單機制,我建議對于一些有惡意的站長,可以永久封殺。
愛情就是犯。賤,而且還是一次又一次的犯。賤。什么時候你不犯。賤了,女人就來了!