- 相關推薦
搜索高手煉成三部曲——搜索引擎的原理、技巧與運用
搜索高手煉成三部曲——搜索引擎的原理、技巧與運用徐 煒
(江蘇省靖江高級中學)
摘 要:《普通高中信息技術課程標準》中"信息采集與加工"模塊是信息處理的起點。其中,通過計算機和網絡進行信息的搜索是信息采集的重要途徑。為了幫助人們在浩瀚的因特網中快捷、有效地搜索到所需信息,計算機技術專員研發了搜索引擎及相關技術,主要是針對Web頁面的文本檢索工具,能夠迅速、準確地檢索到用戶需要的信息。在此,將重點研究全文搜索引擎的基本工作原理、提煉關鍵詞的技巧及搜索引擎的靈活運用。
關鍵詞:搜索;關鍵詞;運用
現今時代,網絡已經深入我們日常生活的每個角落,因特網已成為當今社會人們獲取信息和相互交流的主要渠道。其中,通過計算機和網絡進行信息的搜索是信息采集的重要途徑。隨著信息的不斷增長,共享在網絡上的信息量迅速膨脹,大容量的信息資源影響著網絡信息的有序性,造成了人們及時查找信息或組織信息的困擾。為此,計算機技術專員研究與開發了搜索引擎,解決了人們的這一困擾。作為使用因特網的用戶,知道搜索引擎的基本工作原理,掌握提煉關鍵詞的技巧,加上平時的積累、靈活的應用,必定能更加快捷、有效地在浩瀚的因特網中搜索到所需信息。
搜索引擎主要有分類目錄導航搜索、全文搜索兩種搜索方式。
本文主要討論全文搜索。
一、知道搜索引擎的基本工作原理
1.搜索引擎
搜索引擎是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
2.搜索引擎的一般原理
(1)數據采集與處理
現在的搜索引擎大多采用自動信息搜集功能。每隔一段時間搜索引擎主動派出"蜘蛛"程序,對一定范圍內的互聯網網站進行檢索,一旦發現新的網站,它會自動提取網站的信息和網址加入自己的數據庫。搜索引擎將"蜘蛛"抓取回來的頁面,進行各種步驟的預處理,為搜索做好準備。
(2)信息搜索排名
當用戶以關鍵詞查找信息時,搜索引擎會在數據庫中進行搜尋,如果找到與用戶要求內容相符的網站,便采用特殊的算法——通常根據網頁中關鍵詞的匹配程度、出現的位置、頻次、鏈接質量計算出各網頁的相關度及排名等級,然后根據關聯度高低,(m.baimashangsha.com)按順序將這些網頁鏈接返回給用戶。
二、掌握提煉關鍵詞的技巧
分析搜索引擎的工作原理,搜索結果主要根據關鍵詞的匹配程度、出現的位置、頻次等給出。對于具體搜索問題,提煉關鍵詞成了第一步,也是最關鍵的一步。
1.表述準確
以百度搜索引擎為例。百度會嚴格按照提交的關鍵詞去搜索,因此,關鍵詞表述準確是獲得良好搜索結果的必要前提。一類常見的表述不準確的情況是,腦袋里想著一回事,搜索框里輸入的是另一回事。例如,要查找2013年國內十大新聞,查詢詞可以是"2013年國內十大新聞";但如果把查詢詞換成"2013年國內十大事件",搜索結果就無法滿足需求。
2.少用自然語言,從自然語言中提煉關鍵詞
在提煉關鍵詞時,我們盡量不要用自然語言(所謂自然語言,就是我們平時說話的語言和口氣),而要從自然語言中提煉關鍵詞。這個提煉過程并不容易,但是我們可以用一種將心比心的方式思考:如果我知道問題的解決辦法,我會怎樣對此作出回答。也就是說,猜測信息的表達方式,然后根據這種表達方式,取其中的特征關鍵詞,從而達到搜索目的。
例如,有學生參加2014年江蘇數學競賽的復賽,只知道大概時間在7月份。如何搜索到比賽的具體情況?首先要確定的是,不要用自然語言。比如,"數學復賽的具體情況,誰能告訴我呀".這是典型的自然語言,但網上和這樣的話完全匹配的網頁,幾乎就是不存在的。因此,這樣的搜索常常得不到想要的結果。我們來看這個問題中的核心詞匯。對象:高中生。問題:2014江蘇數學復賽。關鍵詞中,至少應該出現"數學復賽""2014""江蘇",這是問題現象描述。一般情況下,只要對問題作出適當的描述,在網上基本上就可以找到解決對策。例:數學復賽 江蘇 2014.
三、積累點滴,靈活運用
知道全文搜索引擎的基本工作原理和掌握提煉關鍵詞的技巧以后,搜索者可以解決絕大多數的搜索問題。想成為真正的高手,還需要積累點滴,靈活運用。
1.使用高級搜索語法
以百度搜索引擎為例。
(1)用減號去除特定關鍵詞
如果你發現搜索結果中,有某一類網頁是你不希望看見的,而且,這些網頁都包含特定的關鍵詞,那么用減號語法,就可以去除所有這些含有特定關鍵詞的網頁。
例如,搜索水滸傳,希望是關于小說方面的內容,卻發現很多關于電視劇方面的網頁。那么就可以這樣查詢:水滸傳 -電視劇。注意,前一個關鍵詞和減號之間必須有空格,否則,減號會被當成連字符處理,而失去減號語法功能。減號和后一個關鍵詞之間,有無空格均可。
(2)將搜索范圍限定在特定網站
把搜索范圍限定在特定站點中。有時候,你如果知道某個站點中有自己需要找的東西,就可以把搜索范圍限定在這個站點中,提高查詢效率。使用的方式是在查詢內容的后面加上"site:站點域名".
例如,你知道新浪博客上有不少學習的文章,就可以這樣查詢:快速排序site:blog.sina.com.cn注意,"site:"后面跟的站點域名,不要帶"http://";另外,"site:"和站點名之間,不要帶空格。
2.嘗試特色搜索服務
百度搜索,使用者用得最多的是"網頁"搜索。打開百度網站"全部產品"鏈接,有搜索服務、新上線、導航服務、社區服務、游戲娛樂、移動服務、站長與開發者服務、軟件工具、其他服務等分類。仔細瀏覽各個服務分類,幾乎囊括了因特網上信息搜索的方方
面面。
以"百度識圖"為例。有些圖片資源并沒有配備圖片的文字說明,使用者無法了解圖片的完整信息。假如現在有一張動物或植物的圖片,使用者并不識得,想要了解動物的名稱、習性等信息,就可以嘗試百度識圖。百度識圖的圖片通過兩種方式來使用,有圖片文件的通過"本地上傳",將圖片上傳到百度;或者粘貼圖片網址到百度識圖搜索框中搜索。
"百度尋人"也是一項特色服務。百度尋人是百度推出的公益互動開放平臺。借助百度業界領先的搜索技術、龐大的用戶規模、海量的數據優勢,建立全國范圍內失蹤人員的開放數據庫,并利用中國科學院計算技術研究所無償提供的人臉識別技術迅速匹配失蹤人員的照片,幫助家長和熱心網友第一時間獲取信息。
3.嘗試不同搜索引擎
百度搜索是常用的搜索站點,在解決一個搜索問題時,關鍵詞提煉準確了,搜索的結果還是不令人滿意,這時可以換個搜索引擎試試。
筆者的女兒前陣子從幼兒園老師那里領回來一個親子活動任務,做一個燈籠狀的裙子。用什么材料呢?用布匹的話就得請專業裁縫師了,考慮可以使用廢舊報紙做材料。提煉的搜索關鍵詞是"紙裙""燈籠".使用百度搜索,可以找到相關信息,有實際指導如何做的網頁較少。嘗試使用搜狗更快地找到了所需信息。
4.嘗試專業網站
對于專業性強、嚴肅性高的信息,使用專業網站更能達到搜索需求。專業網站中收錄的信息資源專業性強,主題明確,檢索的相關性高。資源入庫前進行了嚴格的定向篩選,質量比較高,具有較高的權威性。
例如,想要搜索"義務教育法"相關的內容,找到專業網站:法律信息網,在該網站搜索框中輸入關鍵詞:義務教育法。搜索結果中不僅有義務教育法的全文,還有各地政府實施義務教育法的辦法和情況信息。
專業網站的使用是個日積月累的過程,在日常的搜索過程中要注意搜集和甄別,找到不同分類的專業網站并收藏,使用時就能快速搜索到有價值的信息。
知道搜索引擎的基本工作原理、掌握提煉關鍵詞的技巧、積累點滴和靈活運用,這三個部分在開始學習、應用中有前后順序關系。學習、應用到一定階段,用戶有了實踐體驗后,可以根據需要深入學習搜索引擎的基本工作原理、提煉關鍵詞的技巧等部分,
再實踐、再學習,多思考、多總結,在學習、實踐的交替進行中不斷進步,最終煉成搜索的高手。
參考文獻:
安文廣,魏曉光。搜索引擎及其關鍵技術分析[J].電子制作,2013(17)。
【搜索高手煉成三部曲——搜索引擎的原理、技巧與運用】相關文章:
搜索引擎工作原理08-05
各類搜索引擎的搜索語法應用論文08-24
快速實現搜索引擎的方法08-06
關于搜索引擎的作文500字08-15
網站搜索引擎工作總結08-07
搜索引擎:為電子商務做媒08-05
搜索引擎收費服務協議04-24
搜索引擎:為電子商務作媒08-05
搜索引擎營銷,B2B企業的財富之門08-05