當前位置:學問君>學習教育>畢業論文>

基於多智能Agent計算機科學資訊檢索個性化服務的探討論文

學問君 人氣:4.88K

摘要:

基於多智能Agent計算機科學資訊檢索個性化服務的探討論文

文章論述了智能agent搜尋理論的提出背景,闡述了智能agent的搜尋理論及多種智能agent的功能和工作原理,並在此基礎上構建了一個基於多種智能agent個性計算機科學資訊檢索系統,得出該系統是當今圖書館智能化的主動服務模式。

關鍵詞:智能agent;智能化;主動服務;資訊檢索

1、問題的提出。

近年來,隨着振興東北老工業基地戰略的實施,齊齊哈爾大學加快計算機科學專業的建設與發展,檢索大量的有關計算機科學專業的資訊資源成爲學科館員的必須工作,但網上計算機科學資訊資源浩如煙海,專業數據庫不計其數。透過計算機科學類資訊檢索實踐發現浩瀚如海且不斷變化的計算機科學資訊資源與有效獲取之間存在着尚需解決的技術問題,且越來越明顯,主要表現在以下幾個方面:

(1)搜尋準確性問題。

目前我們使用的大部分搜尋引擎和專業數據庫檢索都是依據查詢字段的匹配來收集資訊,在查詢的結果中,常常包含着一些無用資訊即資訊過載和資源迷向,浪費了用戶的時間與精力。

(2)個性同化問題。

不同的用戶使用同一個搜尋引擎對同一個關鍵詞進行查找,得到的結果均是相同的,毫無個性可言。

(3)結果差異問題。

我們對相同的“計算機編程”進行搜尋時,在百度能搜到770個網頁,而在雅虎中卻可搜到8832765個網頁,在中國期刊全文數據庫中搜到10624篇(精確)論文,而在重慶維普數據庫中卻搜到208篇(精確)論文,體現出不同搜尋引擎產生不同的結果,對同一關鍵詞使用不同的搜尋引擎得出的結果差別很大。

(4)主動服務問題。

我們目前所使用的搜尋引擎都是透過在搜尋引擎中鍵入關鍵詞搜尋才能得到所需要的資訊,而引擎本身不能爲用戶提供主動的服務,這是一種較爲被動的資訊獲取方法。

(5)動態監測問題。

網絡中計算機科學方面的資訊是實時動態變化的,如果爲計算機科學的研究提供更新的資訊,我們只有花費很多時間與精力實時查詢網絡,才能做好服務工作,而在現有搜尋引擎技術條件下,對我們來說是極爲不便的。

這些問題正是數字圖書館個性化資訊服務所要解決的。對於搜尋引擎來說,也是其自身無法克服的,爲適應資訊的個性化需求,一種智能agent搜尋工具已被研發出來,在工業、商業領域廣泛應用,本文擬將該理論引入數字圖書館的.個性化服務中來,探討其在計算機科學資訊檢索中的應用。

2、agent智能搜尋理論。

智能agent的研究起始於20世紀90年代,是人工智能和代理技術的集成運用,它代表了資訊技術最前沿的發展方向,是一個全新的研究開發領域。是具有劃時代意義的智能化、主動服務用戶的研究熱點。

agent智能搜尋理論,核心功能就是智能代理,利用一種計算機軟件(實體)自動執行用戶委託的任務來達到用戶的檢索需求,如學習agent、中介agent、通信agent、資訊協作查詢agent、資訊採集agent、資訊分析agent、資訊傳遞agent等等,每種智能agent都需要相應的技術支援,這些技術包括了人工智能和代理技術、神經網絡技術、資訊檢索技術、計算機網絡技術、數據庫數據挖掘技術、自然語言處理技術等,這些技術,近年來的研究已非常成熟,在這些技術支援下的多種agent組成的智能系統已被開發者廣泛應用於工業和商業領域,智能agent能把用者的需求透過自身的自治性、代理性、學習性、分析性描繪讀者需求、建立匯出資訊模組、自動搜尋資訊。專家學者設計了許多面向agent的建模語言以支援基於藉助於面向agent的軟件,和支援不同系統模型之間轉換的軟件,以使各系統之間相互相容,從而建立起一種逐步求精的agent系統,爲解決網絡中計算機科學專業資訊服務與計算機科學專業資訊搜尋問題提供了新思路。遵循這一理論,我們進行計算機科學專業專業智能檢索的探討。

3、基於多種智能agent的計算機科學專業檢索系統的工作原理。

完成用戶的完整的檢索過程需要許多智能agent的有機配合,以下分別介紹相關的agent在完成用戶檢索過程的工作原理。

(1)資訊採集agent執行網絡的搜尋任務。

資訊採集agent是該系統的核心部分,資訊採集agent是一組獨立執行於各個物理節點上的網絡資訊搜尋程序,它根據所分配的任務和知識庫中的資訊對網絡站點進行遍歷,並把採集到的資訊存進本地資訊庫中。

資訊採集agent工作流程如下:

①初始化時,資訊採集agent派遣資訊協作agent取回知識庫中適當的外部地址作爲執行種子。

②由取回的外部地址作爲初始種子,採集該網站資訊,並把採集到的內部地址資訊存儲到本地資訊庫中的內部地址列表結構中去。

③從本地資訊庫中的內部地址列表中取地址,採集資訊。

④內部地址列表爲空,則表示完成該網站採集任務,執行步驟。

(2)學習agent總結用戶檢索習慣形成個性化的檢索模式。

學習agent安裝在用戶個人機上,每個用戶一個學習agent,學習agent根據用戶註冊資訊瞭解用戶背景、興趣、愛好、檢索目的、任務等,自動從用戶提交的初始的興趣樣本中提取特徵自動學習,並且根據用戶經常的檢索習慣,自動完成用戶檢索習慣的反饋學習任務和用戶個性化模式的生成。學習agent根據用戶的註冊資訊能主動地分析和獲取用戶的個性資訊並根據用戶的興趣模型或當前的環境狀態瞭解用戶的潛在需求,以主動服務方式提供服務,例如,設定計算機科學的資訊,學習agent可根據用戶的資訊和檢索習慣,獲取資訊服務網站地址,自動監測相關網站的更新情況,自動將新資訊推送給用戶,將主動絡上計算機科學資源的使用現狀。

工作流程:

①學習agent將用戶使用類似自然語言的描述限制在一個概念區域中,擁有完成學習任務的準備知。

②然後agent在用戶的教導下不斷訓練,直至能有效地找到用戶感興趣的檢索語言。

③學習agent發揮它的學習和適應能力,形成一種記憶型的模式,能自動代表用戶將用戶經常檢索的問題在網上搜尋,推送給用戶。

(3)中介agent協調整個資訊搜尋過程。

中介agent在整個搜尋過程中至關重要,是實現系統分佈式透明性的關鍵。主要用於協調採集、管理、統計、查詢等各種agent,按其功能分類或建立聯盟,保證各種agent之間的安全通信機制。

工作流程:

①當學習agent從本地機知識庫儲存的資訊狀態,瞭解到用戶和個性化資訊及多次關於計算機科學專業的檢索習慣形成固定的檢索模組。

②根據用戶的需求自動推送計算機科學專業資訊給中介agent檢索。

③中介agent首先把資訊傳遞給各個採集系統中的資訊採集協作agent。

④資訊採集協作agent,與各個資訊採集agent進行交流。

⑤與此同時中介agent與資訊分析agent交流。

⑥資訊分析agent透過調取本地知識庫進行分析,把結果透過資訊分析agent遞給資訊中介agent,中介agent從資訊分析系統中獲得數據,再傳遞給資訊採集系統,完成資訊採集。

(4)資訊協作agen在動態的情況下自主完成搜尋任務。

這是一個可移動的agent(mobileagent),能根據當前動態變化的環境狀態,在無需外界參與的情況下,獨立地發現和利用完成任務所(來源:)需的資源,獨立地制定完成任務的規劃,最終實現規劃、達到目標。

工作流程:

①資訊協作查詢agen移動於採集系統和分析系統。

②從資訊採集agent和數據傳送agent處接受協作資訊查詢請求。

③再從中介agent系統獲得目標系統地址後,移動到這個新的目標主機,完成資訊查詢任務。

(5)資訊傳輸agent。

資訊傳輸agent負責把本地資訊庫中已經採集到的資訊安全傳送到sad中去。由於各子系統分

別處於不同的物理節點上,數據傳送的安全性和可靠性就變得尤爲重要。數據傳送agent透過與資訊協作查詢agent以及中介agent的合作有效解決了這一問題。

工作流程:

①數據傳送agent向資訊協作查詢agent發出對目的地系統地址的查詢請求。

②資訊查詢agent從中介agent處取得數據分析子系統的ip地址,並返回給數據傳送agent。

③數據傳送agent根據所得到的目的地址,創建一個數據接收mobileagent,並移動到數據分析系統所在地

④數據接收mobileagent對數據分析系統所在地的網絡通訊質量和系統空閒時間進行評價;⑤若評價值滿足數據傳送質量的要求,數據傳送agent開始向數據接收agent傳送數據,直到數據傳送完畢,收回並銷燬數據接受mobileagent,若評價值不能滿足要求,直接收回並銷燬數據接收mobileagent。

(6)數據分析agent透過智能篩選呈現給用戶理想的檢索結果。

數據分析agent負擔着對採集回來的數據進行文字化、中文分詞和評價網站的任務。由數據接收mobileagent、資訊協作查詢agent、數據分析agent協作完成。平時,數據分析agent處於休眠狀態,不加載入內存,當有新數據傳送到sad本地時,數據分析agent被激活,從硬盤上讀入狀態數據,進入工作狀態。

①數據進行統一化,採集到的數據可能是一段html代碼、pdf檔案、word檔案等,統一化就是利用代碼轉換方法把這些數據轉化成純文字格式。

②如果其中有中文詞彙,則調用中文分詞模組進行中文分詞,並調用專業詞庫與其中的專業詞彙相比較,統計網站中出現專業詞彙的頻率,把結果寫入知識庫中,作爲對網站與本專業相關度的評價,把相關內容插入索引數據庫,若沒有中文詞彙,則與專業詞彙比較,並形成索引。

4、基於多種智能agent的計算機科學專業檢索系統的工作流程。

多種智能agent相互協作完成計算機科學檢索任務的工作流程:本地知識庫存儲用戶的註冊資訊,學習agent由中介agent獲取用戶的檢索模式交給採集agen並透過採集agent採集資訊,採集agent把採集的結果透過協作agent、接收agent交於分析agent,分析agent經過處理把理想化的結果儲存到知識庫中,完成檢索任務。在整個過程中體現的是智能化的主動的推送的服務,是智能採集agen根據用戶註冊的個性化資訊資料、並把多次的檢索習慣透過學習建立模組,自動採集網絡,完成服務的。整個過程體現的是主動的服務方式,是當今圖書館智能化的主動服務模式。

參考文獻

[1]蔡棟.第二代搜尋引擎模式探析[j].情報理論與實踐,,(3)。

[2]漆宏,等。談談個性化資訊服務[j]。情報資料工作,(4)。

[3]韓立新,等。一個面向internet的個性化資訊檢索系統模型[j]。電子學報,(2)。

[4]劉穎.多智能agent系統的結構與功能[j].圖書情報知識,,(4)。