當前位置:學問君>學習教育>畢業論文>

資訊檢索結課論文

學問君 人氣:3.06W

高校作爲培養國家各種管理和科研人才的搖籃,必須上好資訊檢索課。資訊檢索課和其他課程既有共性,又有自身獨特的規律。以下是小編整理的資訊檢索結課論文,歡迎閱讀。

資訊檢索結課論文

1.簡述

資訊檢索與利用課(簡稱“資訊檢索課”)是高校素質教育、人才培養的重要內容,目的是培養學生的資訊獲取與利用能力及創新意識。它具有較強的理論性和複雜的實踐性,其講授難度較大,要獲得好的教學效果實屬不易,近年來該課程在一些院校甚至呈現出萎縮之勢[1]。許多教師實踐經驗不足,不能科學合理地構建檢索策略,更不能傳授相關技能,因此影響了教學效果。縱觀國內資訊檢索課教材,資訊檢索策略部分也是最薄弱的環節,這也得到了印證。由於高校大學生檢索技能的欠缺,直接影響了資訊利用的效果和自身資訊素質的提高。

資訊檢索課的重點內容是檢索策略的傳授,這關係到學習者的實際動手能力。國外對檢索策略的研究較多,其主要的檢索策略模式有:交互掃描式策略、積木型策略、引文珠串增長策略、逐次分餾策略、最專指面優先策略、最低登入量的面優先策略等等[2-3]。然而,國內對這幾種檢索策略模式的適用範圍、應用技巧等卻少有研究;少數教師在教學中蜻蜓點水式地提一下,也常常不得其要領,學生們更是霧裏看花。有“專家”對“逐次分餾策略和最低索引次數優先策略”是1個、還是2個檢索策略都分辨不清,卻能混爲一團、大發議論,讓人啼笑皆非。在國內高校資訊檢索案例教學中,檢索實例的選擇有很大的隨意性,檢索策略的調整、優化也存在不少問題[4]。有“專家”認爲“實例應符合檢索策略的要求”;然而,檢索策略通常是指檢索項目的實施方案,對特定的檢索實例,纔會有相應的檢索策略,這是常識!本末倒置、不懂裝懂是要誤人子弟的。爲此,筆者以教學案例來進行分析、講解。

2.檢索策略的構建及優化

這裏,藉助於一個典型的檢索實例,採用國際上較爲流行並適合國內運用的3種檢索策略模式,分別進行前期的概念組面確定、試檢摸底和相關詞篩選,最後一併擬定檢索提問式;以便比較、分析。選用維普期刊全文數據庫,對案例“城市垃圾綜合處理”的檢索要求,可以分別進行如下的處理:

(1)交互掃描式(Interactive Scanning)策略。通常是依據若干相關文獻(或課題名稱),先進行籠統的搜尋;透過瀏覽命中文獻,深入瞭解、分析課題的主題內容,並找出課題的關鍵特徵(如技術方法、專業術語、作者等),以便擬定相應的檢索式;透過多輪的“交互掃描”、分析處理,有助於不斷地完善檢索策略。

採用交互掃描式策略的前處理。根據課題名稱,選取概念組面,用簡單的.檢索式“城市*垃圾”,對相關度較高的題名字段進行籠統的搜尋;首先獲得一些相關文獻,以便掌握課題的專業內容、主題範圍;因此瞭解到:城市垃圾處理是一個世界性難題,而垃圾又可以說是放錯地方的資源,實現城市垃圾的資源化、無害化、減量化處理,可取得很好的環境經濟效益,並保障城市的可持續發展。先進的垃圾處理技術多種多樣,如:高技術垃圾分選處理、垃圾無害化處理篩選回收、利用動物和微生物處理垃圾、廢纖維飼料化技術、垃圾制建材、垃圾產燃料油、垃圾焚燒發電、垃圾制有機肥料、垃圾產沼氣技術、垃圾綜合處理自動化控制系統等等。

由上可見,本課題內容涉及的技術面很廣,透過主題分析,要達到高網羅度,檢索概念的科學處理至關重要。經過多輪的“交互掃描”,並分別逐篇地瀏覽命中記錄的題名、關鍵詞(需要時再瀏覽文摘),篩選各相關檢索詞;其中,表達概念組面“城市”的相關檢索詞有“城市、大城市、中小城市、中等城市、北京市、上海市、天津市、重慶市......”,對應概念組面“垃圾”的相關檢索詞有“垃圾、廢物、廢棄物”,對應概念組面“綜合處理”的相關檢索詞有“處理、回收、再生、利用”等。

(2)積木型(build block)策略。是將課題分解爲若干概念組面(概念“塊”),先分別試檢,儘可能選全各種同義詞、近義詞、相關詞(各詞之間爲“邏輯或”的關係),各概念組面再進行“邏輯與”組配,構成檢索式。這種策略類似把各個積木塊拼成完整圖案,因此稱爲積木型檢索策略。

採用積木型策略的前處理。根據課題內容,分解出3個概念組面:城市、垃圾、綜合處理。然後逐個對題名字段試檢,透過瀏覽命中文獻記錄的相關字段,儘可能選全分別對應3個概念組面的各相關檢索詞;然而,各單一概念組面的搜尋,專指性不強,範圍較寬,命中文獻量大,在篩選相關檢索詞時,需要瀏覽大量檢索記錄,花費較多時間,才能得到與前一個檢索策略相似的結果。

(3)引文珠串增長(citation pearl growing)策略。即從課題中最專指的詞(概念組面)開始初步檢索,由檢索到的文獻中選出一些新的相關詞,然後補充到提問式中再次檢索,周而復始,直至找全相關檢索詞或者得到數量適宜的命中結果。這就像串珍珠似的,越串越多,故稱之爲引文珠串增長策略。

採用引文珠串增長策略的前處理。即從課題中最專指的概念組面“垃圾”開始初步檢索,由檢索到的文獻記錄中選出一些新的相關詞,然後重新構造檢索提問,再次搜尋,周而復始,使搜尋掃描的專指度不斷提高,因此找到了相關“珠串”:垃圾、廢物、廢棄物;另根據所涉及的概念組面“城市”和“綜合處理”,串聯的“珍珠”越來越多:城市、大城市、中小城市、中等城市、北京市、上海市、天津市、重慶市……處理、回收、再生、利用等。

(4)利用以上3種檢索策略以不同的方式進行前期處理,分別獲得了各相關檢索詞,然後再擬定正式的檢索提問式。由於維普期刊庫有正規的主題標引,其單漢字索引方式,實現了先進的模糊檢索功能,便於檢索策略的優化。鑑於我國的城市達數百個之多,若一一羅列檢索,則過於繁瑣;此時可選用單漢字“市”,指定在題名字段對錶達概念組面“城市”的上述相關檢索詞進行模糊匹配檢索,由於用其它2個概念組面限定了主題範圍,查準率是可以保障的;這樣,提問式得以大大地簡化,最終擬定檢索式如下:

市*(垃圾+廢物+廢棄物)*(處理+回收+再生+利用)

上式簡練明瞭,所用檢索詞網羅度很高,僅在題名字段搜尋便命中了2010年以來的數百篇較新文獻,獲得了理想的查全效果,同時也達到了較高的查準率。

3.小結

積木型策略分別由單一概念組面搜尋、選詞,花費時間較多;但此方法條理清晰、簡潔明瞭,分步操作、容易掌握,便於初學者入門。交互掃描式策略透過邊搜尋邊瞭解主題內容,經瀏覽、篩選,確定檢索詞、擬定檢索式,其效率較高。引文珠串增長策略從最專指的概念組面入手,針對性強,其方式靈活多變,便於調整、優化。由於檢索項目的千差萬別,相應的檢索策略也變化多端,有時不必僅套用某一個模式,要隨機應變、靈活處理、不斷優化,一個充滿技巧、睿智的優秀檢索策略,將給教學內容平添不盡的魅力。另外,學會測試數據庫系統的檢索功能、判定數據庫的質量和索引方式,也是檢索策略質量的保障[5]。

參考文獻:

[1]鄢百其.資訊檢索策略優化分析[J].武漢科技大學學報(社會科學版),2011(2).

[2]鄢百其.便於快速入門的檢索策略模式[J].情報理論與實踐,2011(12).

[3]鄢百其.資訊檢索策略(資訊檢索,第九章)[M].杭州:浙江大學出版社,2012.

[4]鄢百其.資訊檢索教學案例剖析[J].武漢冶金管理幹部學院學報,2012(1).

[5]鄢百其.計算機檢索策略優化研究[J].武漢冶金管理幹部學院學報,2009(1).