當前位置:學問君>學習教育>畢業論文>

淺談粒度計算

學問君 人氣:1.35W
淺談粒度計算
摘要:粒度是新近興起的人工智能研究領域的一個方向,本文簡單介紹粒度計算的主要三個方法,以及之間的關係。關鍵詞:粒度計算、模糊邏輯、商空間理論、粗糙集理論。 一.引言       人們在思考問題時,或者是先從總體進行觀察,然後再逐步深入地研究各個部分的情況;或先從各個方面對同一問題進行不同側面的瞭解,然後對它們進行綜合;或是上面兩種方法的組合,即時而從各側面對事物進行了解,然後進行綜合觀察,時而綜合觀察後,對不甚瞭解的部分再進行觀察……總之,根據需要從不同側面、不同角度反覆對事物進行了解、分析、綜合、推理.最後得出事物本質的性質和結論.      人工智能研究者對人類這種能力進行了深入地研究,並建立了各種形式化的模型.本文要介紹的粒度計算,就是對上述問題的研究的一個方面.        人工智能最主要的目的是,爲人類的某些智能行爲建立適當的形式化模型,以便利用計算機能再顯人的智能的部分功能。什麼是人類的最主要的智能,或者說智能的最重要表現形式是什麼。各家有不同的看法,如Simon等認爲人的智能表現爲,對問題求解目標的搜尋(Search)能力。比如學生在證明一道平面幾何題目時,進行思考,“聰明的小孩”能很快地找到證明該結論的有關的定理性質,並很快地應用上去,從而就得到證明。“數學能力差的學?笨贍芏?椅餮埃?也壞膠鮮實畝ɡ硨託災剩?評慈迫ィ?艿貌壞街っ韉囊?歟籔awlak[P1]則認爲人的智能表現爲對事物(事件、行爲、感知等)的分類(Classification)能力。如平時我們說某醫生本事大,就是這位醫生能從病人的症狀中,正確地診斷出病人是患什麼病(分類能力!分出患什麼病來)等等。我們認爲“人類智能的公認特點,就是人們能從極不相同的粒度(Granularity)上觀察和分析同一問題。人們不僅能在不同粒度的世界上進行問題求解,而且能夠很快地從一個粒度世界跳到另一個粒度的世界,往返自如,毫無困難。這種處理不同世界的能力,正是人類問題求解的強有力的表現”[ZH1]。還有很多不同的理解,人們正是從這些不同的理解分別建立各自的模型和相關的理論和方法。粒度計算目前國際上有三個主要的模型和方法,下面簡單進行介紹。 二. 三種不同的模型      下面簡單介紹有關“粒度計算”的三個不同的模型和方法。      什麼是粒度,顧名思義,就是取不同大小的對象。也就是說,將原來“粗粒度”的大對象分割爲若干“細粒度”的小對象,或者把若干小對象合併成一個大的粗粒度對象,進行研究。      最近Zadeh在[ZA1]-[ZA3]中,討論模糊資訊粒度理論時,提出人類認知的三個主要概念,即粒度(granulation)、組織(organization)、因果(causation)(粒度包括將全體分解爲部分,組織包括從部分集成爲全體,因果包括因果的關聯)。並進一步提出粒度計算。他認爲,粒度計算是一把大傘它覆蓋了所有有關粒度的理論、方法論、技術和工具的研究。指出:“粗略地說,粒度計算是模糊資訊粒度理論的超集,而粗糙集理論和區間計算是粒度數學的子集”。       Zadeh 的工作激起了學術界對粒度計算研究的興趣,和他的合作者對粒度計算進行了一系列的研究[Y1]-[Y3]並將它應用於數據挖掘等領域,其工作的要點是用決策邏輯語言(DL-語言)來描述集合的粒度(用滿足公式f元素的集合,來定義等價類m(f)),建立概念之間的IF-THEN關係與粒度集合之間的包含關係的聯繫,並提出利用由所有劃分構成的格,來求解一致分類問題。這些研究爲知識挖掘提供了一些新的方法和角度。        按Zadeh粒度計算的定義,我們提出的商空間理論和Pawlak的粗糙集理論都屬於“粒度計算”範疇。       目前有關粒度計算的理論與方法,主要有三個。一是Zadeh的“詞計算理論”(Theory of Works Computing),一是Pawlak的“粗糙集理論”(Theory of Rough Set),另一個是我們提出的“商空間理論”(Theory of Quotient Space)。下面簡單介紹三者的內容:1.    詞計算理論:        Zadeh認爲人類在進行思考、判斷、推理時主要是用語言進行的,而語言是一個很粗的“粒度”,如我們說“九寨溝的風景很美”,其中“很美”這個詞就比較“龐統”,也就是說其粒度很粗,如何利用語言進行推理判斷,這就是要進行“詞計算”,早在二十世紀六十年代Zadeh提出模糊集理論,就是“詞計算”的雛型。沿Zadeh的模糊集論的方向,用模糊數學的方法進行有關粒度計算的方法和理論的研究,就構成“粒度計算”的一個非常重要的方法和方向。這也是人們比較熟悉的一個方法。2.       粗糙集理論:        波蘭學者Pawlak[P1]在二十世紀八十年代,提出的'粗糙集理論,他提出一個假設:人的智能(知識)就是一種分類的能力,這個假設可能不是很完備,但卻非常精練。在此基礎上提出,概念可以用論域中的子集來表示,於是在論域中給定一組子集族,或說給定一個劃分(所謂劃分,是指將X分成兩兩不相交的子集之並)。從數學上知道,給定X上的一個劃分,等價於在X上給定一個等價關係R。Pawlak稱之爲在論域上給定了一個知識基(X,R)。然後討論一個一般的概念x(X中的一個子集),如何用知識基中的知識來表示,就是用知識基中的集合的並來表示。對那些無法用(X,R)中的集合的並來表示的集合,他借用拓撲中的內核和閉包的概念,引入R-下近似R-(x)(相當於x的內核)和R-上近似R-(x)(相當於x的閉包),當R-(x)¹R-(x)時,就稱x爲粗糙集.從而創立了“粗糙集理論”。目前粗糙集理論已被廣泛應用於各個領域,特別是數據挖掘領域,並獲得成功。3.基於商空間的粒度計算.        我們認爲概念可以用子集來表示,不同粒度的概念就體現爲不同粒度的子集,一簇概念就構成空間的一個劃分----商空間(知識基),不同的概念簇就構成不同的商空間. 故粒度計算,就是研究在給定知識基上的各種子集合之間的關係和轉換.以及對同一問題,取不同的適當的粒度,從對不同的粒度的研究中,綜合獲取對原問題的瞭解.這種對粒度的理解與模糊集對粒度的理解不完全一樣.下面簡單介紹基於商空間的粒度計算。3.1商空間模型下的推理模型       商空間的模型用一個三元組來表示,即(X,F,T),其中X是論域,F是屬性集,T是X上的拓撲結構.當我們取粗粒度時,即給定一個等價關係R (或說一個劃分),於是我們說得到一個對應於R的商集記爲[X],它對應於的三元組爲([X],[F],[T]),稱之爲對應於R的商空間.商空間理論就是研究各商空間之間的關係、各商空間的合成、綜合、分解和在商空間中的推理。在這個模型下,可建立對應的推理模型,並有如下的性質.A. 商空間模型中推理的“保假原理”(或“無解保持原理”).B.      商空間模型中推理合成的“保真原理”.所謂“保假原理”是指若一命題在粗粒度空間中是假的,則該命題在比它細的商空間中一定也無解。所謂“保真原理”,是指,若命題在兩個較粗粒度的商空間中是真的,則(在一定條件下),在其合成的商空間中對應的問題也是真的。        這兩個原理在商空間模型的推理中起到很重要的作用,如若我們要對一個問題進行求解,當問題十分複雜時,常先進行初步分析,即取一個較粗粒度商空間,將問題化成在該空間上的對應的問題,然後進行求解,若得出該問題在粗粒度空間中是無解,則由“保假原理”,立即得原問題是無解的。因爲粗粒度的空間規模小,故計算量也少,這樣我們就可以以很少的計算量得出所要的結果,達到“事半功倍”的目的。       同樣利用“保真原理”也可達到降低求解的複雜性目的,設在兩個較粗空間X1、X2上進行求解,得出對應的問題有解.利用“保真原理”可得,在其合成的空間X3上問題也有解。設X1、X2的規模分別爲s1、s2。因爲一般情況下,X3的規模最大可達到s1s2。於是將原來要求解規模爲s1s2空間中的問題,化成求解規模分別爲s1、s2的兩個空間中的問題。即將複雜性從“相乘”降爲“相加”。 四.商空間理論、粗糙集理論和模糊集理論之間的關係4.1在模型上三者都是描述人類能按不同粒度來處理事物的能力的模型.商空間理論、粗糙集理論認爲概念可以用子集來表示,不同粒度的概念可以用不同大小的子集來表示,所有這些表示可以用等價關係來描述。詞計算理論認爲概念是用“詞”來表示,而描述“詞”的有效的方法就是模糊集理論。