當前位置:學問君>學習教育>畢業論文>

網絡資訊資源組織研究進展

學問君 人氣:2.68W
網絡資訊資源組織研究進展
【內容提要】主要從用於組織網絡資訊資源的搜尋引擎、虛擬圖書館、文獻分類法、主題法、視窗方式等方面全面總結與回顧20世紀90年代以來網絡資訊資源組織的理論與實踐。
【摘要題】資訊資源建設
【關鍵詞】網絡資訊資源組織/網絡資訊資源整序/研究進展
   筆者透過普查大量國內外期刊論文及有關出版物、分析相關網站,進而總結與回顧20世紀90年代以來網絡資訊資源組織的理論與實踐,以期有助於優化其網絡資訊資源組織與揭示方法,促進該領域研究的蓬勃開展。本文着重總結網絡資訊資源組織的研究進展,有關其揭示方法將在另文總結。
      1 用於組織網絡資訊的搜尋引擎方式
    (1)關於搜尋引擎組織方式。
  對於搜尋引擎而言,網絡資訊組織採用主題樹和數據庫兩種方式,也有稱使用語詞組織知識和使用分類法組織知識。所謂主題樹組織方式,就是將資訊資源按照某種事先確定的概念體系,分門別類地逐層加以組織,用戶透過瀏覽的方式層層遍歷,直到找到所需的資訊線索,再透過資訊線索聯接到相應的網絡資訊資源。現有的`提供目錄分類式(或稱主題指南、列表瀏覽)查詢功能的搜尋引擎就採用這種方法組織資訊。而數據庫組織方式,就是將所有已獲得的網絡資訊資源以固定的記錄格式存儲,用戶透過關鍵詞及其組配查詢,就可找到所需要的資訊線索(即相關站點連結),並透過資訊線索直接連接到相應的網絡資訊資源。
    (2)關於搜尋引擎的比較研究。
  ①搜尋引擎的性能比較研究。早期研究大量集中在概要性介紹方面。殷雪松、徐斌分別介紹了12個大陸地區的中文搜尋引擎網易、天網、華好網景、搜狐、四通方利、常青藤、北極星、悠遊、搜尋客、司南、我是野虎、若比鄰等,港臺地區茉莉之窗、哇塞、蕃薯藤等和5個國外的中文搜尋引擎Yahoo雅虎中文、AltaVista(中文版)、Globepage(中文版)、華頁指南、中文查尋。
  王忠、周士波分別介紹了獨立搜尋引擎Altavista、Hotbot、Infoseek、Excite、Webcrawler、元搜尋引擎Cyber411、Dogpile、Highway61、InferenceFind、Mamma、Profusion、Savvysearch、All4one和網絡英文搜尋引擎Webcompass、Copernic98,並對6種主要搜尋引擎的基本查尋、進階查尋、限定查尋、結果排序、結果輸出等檢索性能進行比較分析。
  隨着研究的不斷深入,研究重點轉入到了搜尋引擎性能的比較上。孫麗等選取了北極星、常青藤、搜狐、中經網資訊導航、網現引擎5箇中文搜尋引擎,從數據庫類型、規模、庫更新頻率、抓取方式、日抓取頁面數、抓取深度、<Meta>tag、顯示方式、資訊排序依據、資訊描述質量、介面友好程度、用戶歡迎程度等分析它們的優劣。徐建華等從數據庫規模、資訊採集方式、標引內容、檢索功能、結果顯示格式、結果排序規則、數據庫更新頻率等7個方面對Altavista、Excite、Go、Hotbot、Lycos、Yahoo這6個搜尋引擎逐一進行分析。
  張燕,惠佳穎就10個檢索提問,從檢索功能(布爾檢索、鄰近檢索、截詞檢索等)、查準率、用戶負擔、輸出方式對搜尋引擎Google和AskJeeves進行詳細比較,測試結果顯示Google在查準率以及輸出方式上明顯優於AskJeeves,在檢索功能及用戶負擔上兩者各有特色。
  ②關於搜尋引擎的質量評價指標。搜尋引擎評價指標多種多樣。1973年Lancaster和Fayen提出了6條關於資訊檢索系統效果評價指標:即覆蓋範圍、查全率、查準率、響應時間、用戶負擔及檢索結果輸出格式。這一評價指標影響甚廣,許多學者在其基礎上進行細化與擴充,提出搜尋引擎質量評價標準。
  儲荷婷提出5條標準:A.索引構成(取決於標引數量、標引範圍、索引詞抽取法和索引更新頻率);B.檢索功能;C.檢索效果(由查全率、查準率和檢索時間衡量);D.檢索結果顯示(顯示內容、顯示數量以及是否按相關性排序);E.用戶所需努力(從用戶介面和幫助介紹材料)。
TAGS:研究進展