當前位置:學問君>學習教育>畢業論文>

資訊檢索的小論文

學問君 人氣:2.39W

資訊檢索,是指將資訊按一定的方式組織和存儲起來,並根據資訊用戶的需要找出有關的資訊過程。以下是小編整理的資訊檢索的小論文,歡迎閱讀。

資訊檢索的小論文

資訊檢索的小論文1

圖書情報的資訊檢索也就是把資訊進行整理、排序、歸納以及存儲起來,這樣不僅能夠展現情報的內在特徵,還能夠反應情報的外在形式。衆所周知,傳統的圖書情報搜尋模式已不能夠適應現代社會的發展,現在人們更加的追求智能化的資訊檢索方式,在資訊檢索的過程中,把高科技的技術以及方法引入到圖書情報管理工作中,確保圖書情報更加的真實科學。

一、我國資訊檢索在圖書情報應用中存在的問題

1.資訊檢索技術不完善

目前,資訊檢索在圖書情報中的應用仍然不是很完善,其中主要包括以下兩個方面:一方面是知識的獲取和技術的表達存在一些問題。把複雜多樣的專業知識形成一個比較系統的、有規律的模式,往往是比較複雜的。另一方面是由於語言處理方面的侷限,在進行檢索工作的時候,檢索者的文化素養以及專業知識往往直接影響着檢索所出現的結果。因此若想使計算機能夠準確的把握檢索者輸入的各種語言方式,將大大提高檢索的效率,然而在實際的檢索過程中,由於計算機只能夠接收一些簡單的、規範的語句,大大降低了檢索效率。

2.資訊檢索系統本身的障礙

檢索者在進行圖書情報檢索的過程中,容易出現各種問題,其中資訊檢索系統本身就存在一定的侷限。首先,資訊檢索的用戶往往來自不同的專業領域,他們知識水平和專業素質都不相同,這使得計算機很難對其進行一個合理的定位。其次是圖書情報不僅存在一定的豐富性,還存在一定的複雜性,而將那麼多綜合複雜的資訊整個到一個系統當中,是一件非常困難的事情。最後是圖書情報檢索專家系統不易建立,一方面是這些專家的經驗和技術不能夠準確的表達,另一方面是不同檢索專家往往具有不同的觀點,這都對圖書情報檢索專家系統的建立,帶來一定的困難。

3.我國的情報技術發展落後

衆所周知,相對於國外的情報技術的發展,我國的情報技術明顯落後,這嚴重影響了資訊檢索在圖書情報中的應用。同時我國在對於資訊檢索技術上的人力、財力以及物力的投資也明顯沒有國外高。總而言之,由於我國對於情報技術的重視程度不高,在很大程度上影響了資訊檢索的發展。

二、資訊檢索在圖書情報中應用的幾點建議

1.建立理論基礎,打破傳統思維模式

任何一項技術都有理論依據,資訊檢索也不例外,然而目前大多數負責的圖書情報的管理工作人員不能夠很好的理解資訊檢索在圖書情報中的作用,因此在今後的發展過程中,要對資訊檢索建立一定的理論依據,並且打破傳統的思維模式,促進資訊檢索的發展。資訊檢索就是要確保圖書情報能夠進行有組織的、有規律的分類和歸納,同時也要讓工作人員明白其中的複雜程度,讓他們認真對待資訊檢索在圖書情報中的應用,以提高圖書情報的發展。

2.圖書情報檢索專家化

在圖書情報中推廣資訊檢索,可以嘗試成立專門的圖書情報檢索小組,讓資訊檢索在圖書情報中受到重視。衆所周知,我國對於圖書情報的檢索往往不夠重視,導致了圖書情報檢索工作停滯不前,因此,在今後的圖書情報檢索發展的過程中,要建立由國家情報資訊機構牽頭以及各行各業的專家組成,確保我國圖書情報資訊檢索工作在今後的發展過程中能夠有組織、有計劃,以此來打破各自爲政的發展方式,確保我國圖書情報檢索向着統一化、系統化、智能化的方向發展。

3.加強自身知識建設,提高專業水平

加強圖書情報教育,要從大學生教育開始。因此在今後的發展過程中,要全面的提高學生的基本素質,培養大學生的情報資訊素養,確保他們能夠熟練的運用當代的資訊檢索技術進行圖書情報的獲取。在學習的過程中,圖書情報資訊的識別、歸納綜合處理資訊以及傳遞資訊等是基本技能,因此一定要確保大學生能夠掌握以上技能。而高水平的檢索者能夠對圖書情報進行一定分析和判定,善於利用資訊檢索,確保資訊檢索在圖書情報中能夠得到很好的應用,讓我國的資訊檢索在圖書情報中得到更好的發展。衆所周知,未來是一個資訊技術發達的社會,誰先掌握了技術,誰就能夠主宰這個社會,因此在今後的發展過程中,要不斷的學習和發展人工智能技術,確保我國圖書情報的發展。

三、圖書情報人員必須接受的教育

若想確保我國圖書情報的發展,就必須對圖書情報人員進行教育和培訓。首先要擴展他們的知識,對圖書情報工作人員不僅要補充他們的知識,還要確保他們知識結構的合理化。同時還要培養他們的計算機以及外語水平,確保他們能夠勝任圖書情報這一工作。其次要對圖書情報工作人員的知識進行更新,現在技術和知識都發展很整理快,圖書情報工作人員爲了能夠更好的掌握圖書情報工作,就要不斷的學習,不斷的更新自己的知識。最後是培養圖書情報工作人員的科研能力,圖書情報工作人員只有敢於探索,敢於鑽研,才能夠推動圖書情報工作的發展。

總結語

綜上所述,目前在我國資訊檢索在圖書情報的應用仍然不夠完善,其中不僅由於技術發展的落後,還由於缺乏專業的圖書情報工作人員。因此在今後的圖書情報的發展過程中,相關部門要重視圖書情報工作,不惜投入大量的資金和人力,以促進我國圖書情報的發展。

資訊檢索的小論文2

引言

互聯網的快速發展和廣泛應用,爲人們提供了一個廣闊的資訊空間,也爲資訊檢索提供了一個廣闊的發展平臺。互聯網的開放性和自由性使得網絡資訊資源呈現出數量巨大、異構性、分散性和動態性特徵。但由於網絡資訊時效性強以及互聯網缺乏必要的監督和質量控制,使得大量垃圾資訊混於高質量資訊當中,增加了有效資訊獲取的難度,影響檢索效率。因此,使用有效的檢索工具才能使得網絡資訊資源爲人們所充分利用。

1 網絡資訊資源點與檢索工具

上世紀90年代中期出現的搜尋引擎技術目前已經成爲檢索各類網絡資訊資源最主要的檢索工具。搜尋引擎一般工作流程是藉助於網絡自動搜尋軟件(Robot、Spider等)訪問瀏覽網頁並抓取檔案,並透過已瀏覽的網頁中的連結訪問更多網頁。在抓取網頁的同時對頁面檔案進行分析分解以及索引,建立索引數據庫。當用戶在搜尋引擎介面輸入搜尋詞後,搜尋引擎對搜尋詞進行處理,按照處理後的搜尋詞在索引數據庫中找出所有包含相關內容的網頁,並更具排名算法計算出排名順序然後按照一定的格式返回到搜尋頁面。普通的搜尋引擎缺點在於返回的檢索結果數量巨大,無關和冗餘資訊較多,用戶必須從中進行篩選。雖然布爾運算、截詞運算、自然語言檢索等技術使用大大提高了準確率,但對用戶檢索素養要求很高。針對以上問題,學者把研究對象放到對詞意的挖掘上,探索實現基於概念匹配的檢索技術和方法,基於本體的語義檢索成爲研究重點。

2 語義檢索基本要素和原理

隨着人工智能以及自然語言處理的發展,尤其是語義網技術的興起,自上個世紀以來語義檢索研究得到了迅猛的發展。雖然對於語義檢索在概念上到目前爲止沒有統一的界定,但是不同的研究都有一個共同之處就是基於對資訊資源的語義處理時限效率更高的檢索。本體是語義檢索的基礎,其主要任務是對資訊資源進行語義表達。

本體(Ontology)原本是一個描述客觀事物本質的哲學概念,是對客觀存在的一個系統的解釋和說明。如今,本體是一種能在語義和知識層次上描述概念體系的有效工具,用來描述概念以及概念之間的關係,透過概念之間的管理來描述概念的語義。本體作爲一種最先進的知識表示方式能夠充分的描述所以的數據結構,是推理和關係數據庫的結合。概括的講本體能夠在人們和應用系統之間達成對術語含義的共享和共同理解,透過函數(functions)、關係(relations)、原則(axioms)和實例(instances)、類(classes)這5種元素表達本體中的知識,使其具有邏輯推理和語義識別功能,幫助檢索系統跨越目前基於關鍵詞的檢索過程中的上述問題以實現語義檢索。目前實現網絡檢索的技術主要有兩種:第一種,依賴於編碼處理,以分類模式來描述資訊資源以實現檢索的目的;第二種,是透過全文檢索查找文字中包含用戶指定的詞語的`資訊源。語義檢索的語義資訊的提取和處理是基於語義網方法與技術的查詢處理與文檔標註及索引。基於本體的查詢處理包括:查詢消歧和查詢擴展,透過消岐,明確查詢的確切所指,準確反映用戶的資訊意圖,繼而透過加入與其語義相關的其他概念來實施擴展。在對文檔進行語義標註與索引的基礎上,先進行實例檢索,再據此返回所有以檢出實例標註的文檔資訊是語義標註文檔檢索的一種普遍思路。相對於傳統的網絡檢索,基於本體的語義檢索的優勢在於體現語義資訊,準確表達用戶的查詢意圖。

3 常見語義檢索系統介紹

3.1 一體化醫學語言系統(UMLS) UMLS(Unified Medical Language System)作爲計算機化的情報檢索語言集成系統,是美國國立醫學圖書館(NLM)主持的一項長期開發研究計劃。它不僅是自然語言處理、語言規範化以及語言翻譯的規範化工具,更是實現實現跨數據庫檢測的詞彙轉換系統並且還可以幫助用戶連接情報源,包括書目數據庫、事實數據庫、計算機化的病案記錄以及專家系統過程中對於其他的電子式生物醫學情報的一體化檢索。UMLS包括情報源圖譜(Information Sources Map)、語義網絡(Semantic Network)、專家詞典(SPECIALIST Lexicon) )和超級敘詞表(Metathesaurus)四部分。其中超級敘詞表是術語、生物醫學概念、等級範疇、詞彙及其涵義的廣泛集成。1997年第8版的超級敘詞表收錄了739439個詞彙,這些詞彙來源於30多種生物醫學詞表和分類表的能表達33萬多個概念的,詞彙量達到空前規模。而語義網絡是爲超級敘詞表中的所有概念提供語義類型及相互關係結構的工具,是爲建立概念術語間相互錯綜複雜關係而設計的。UMLS的語義網絡不僅運用了常規的語義控制手段,如屬分、相關關係控制、語義等級,同時在語義規範和語義關係分析、延伸等多方面有許多創新。   3.2 語義網(Semantic Web) 爲了能夠在網絡環境下也同樣實現語義檢索的功能進而開發研究了語義網的W3C項目。W3C項目是將網絡上的數據透過一種方式進行連續和定義,透過這種定義和連續可以根據人的不同需求實現計算機將數據自動進行整合以及再利用,從而達到更有利於人機協作的目的。資源描述框架(Re-source Description Framework,簡稱RDF)是語義網的核心構件。在網絡中,一般用元數據對資源進行描述,而RDF則是處理元數據的一個基礎。RDF認爲一個具體的元數據是由屬性值(Statements)、屬性(Properties)和資源(Resources)構成的三元關係模式,實際上是關於一個特定的資源特定屬性的取值聲明。使用RDFS語言,元數據的設計者不僅可以定義所描述資源的類別、屬性以及詞彙,還可以定義這些屬性或者對象的關係以及對象與屬性之間的相互關係,同時還可以進一步定義這些資源的對象、屬性以及屬性應用類別和取值條件等,透過這些定義從而能以計算機理解的標準方式對元數據進行描述語義內容以及元數據的結構關係。

3.3 WordNet WordNet是一種基於認知語言學的英語詞典,它是由普林斯頓大學的計算機工程師、心理學家和語言學家聯合設計的不僅是把單詞以字母順序排列,並且是按單側的意義組成的一個“單詞的網絡”。WordNet將所有的英語詞彙按詞性分爲功能詞、形容詞、動詞、名詞和副詞五類。動詞被組成各種推演關係;名詞在詞彙記憶中被組成主題的層次;而形容詞和副詞被組織在N維超空間中。根據WordNet關係分析最大的優勢是能在他的單詞網裏透過相關關係消除歧義,因爲WordNet分析主要是關係分析。WordNet在名詞的語義消歧率可以超過60%。

4 結語

從以上三個語義系統來看,無論是相對封閉的ULMS系統還是開放式的語義網、wordnet系統都具有較強的靈活性和擴展性。相對於常見的關鍵字資訊檢索,語義檢索不需要用戶使用專業的檢索策略,也不需要語法嚴謹的檢索式,用戶可以將自己的資訊需求透過自然語言直接表達出來。語義檢索在後臺經過大量的計算,分析用戶的用戶的語義文檔資訊,充分利用各種語義關係消除歧義將用戶真正需要的準確的資訊資源反饋給用戶,將用戶的檢索效率提升60—80%。因此,語義檢索無疑是當前資訊爆炸條件下最適合的網絡資訊檢索方式。