當前位置:學問君>學習教育>畢業論文>

數據挖掘技術對軟件工程的應用論文

學問君 人氣:1.51W

摘要:我們如今的生活會遇到大量的資訊,一方面人們隨時隨地可以查閱相關資訊但是另一方面不利於人們來進行分門別類和快速的獲得主要資訊,數據挖掘技術的使用使人們能夠段時間內完成資訊的處理。本文首先介紹了數據挖掘技術的含義和包括的方法,然後闡釋了數據挖掘技術的應用情況並對它面臨的問題進行了分析。

數據挖掘技術對軟件工程的應用論文

【關鍵詞】數據挖掘技術;軟件工程;應用

社會的發展使得技術也得到了快速發展,資訊技術營運而生,並且被人們廣泛的應用於機械、醫療、化工和教育等領域,發揮着越來越重要的作用。在當前社會的發展背景下,資訊技術中的軟件工程雖然發展規模不斷擴大,但是在技術上已經不能滿足對資源管理的要求,而數據挖掘技術的到來彌補了軟件軟件工程的不足,促進了軟件工程的進一步發展

1數據挖掘技術的簡介

1.1數據挖掘技術的含義

所謂數據挖掘,主要指的是在大量的數據資訊中利用科學、有效的算法第一時間獲取到有用資訊的篩選過程。大量的資訊存在於生產和生活領域,使得人們在處理事情是無從下手,這樣大大降低了人們的工作效率,也浪費了工作人員寶貴的時間。而這一問題透過數據挖掘技術的使用得到了很好的解決

1.2數據挖掘技術所採用的方法

在具體的操作中,數據挖掘技術會透過很多方法來使任務得以完成。具體的方法有如下幾種:1.2.1遺傳算法的使用所謂遺傳算法,主要是指基於生物自然選擇與遺傳激勵的隨機搜尋算法,也是數據挖掘技術常用的一種操作方法。遺傳算法的有點就在於表面上看似無聯繫的事物,卻能在事物模型間建立相關的練習,實現事物之間共同發展,現在生物界越來越重視的遺傳基因等的研究,所以這種方法很受人們的歡迎。1.2.2採用決策樹方法這種方法主要用於對資訊的分類和整合,在遇到大量的資訊的時候,能夠在短時間內找出關鍵的資訊,能夠使資訊分類的快速化和簡單化,並且保證了資訊分類的準確度,但是此方法的不足之處就在於具有較差的抗噪性能,不能全面的來表述較爲複雜的概念。1.2.3採用統計分析法往往會利用迴歸分析和主成分分析等方法來分析數據庫字段之間的關係。在字段之間的關係包括相關關係,函數關係也是其中的一種,不同的是函數關係可以用公式來表示,而相關關係則不能透過公示來表示關係,系統分析法的使用爲這種關係的分析提供了便利。1.2.4採用可視化技術可視化技術是採用一些圖表來對數據進行表現,便於對數據的理解,比如,使用簡單圖形來展示存在於數據庫中的多個數據,使研究者看起來一目瞭然,使單調的數據形象化,更容易掌握數據的相關資訊。1.2.5採用神經網絡方法它模擬人腦神經元結構,以MP模型和Hebb學習規則爲基礎,用神經網絡連接的權值表示知識,其學習體現在神經網絡權值的逐步計算上。前饋式網絡、反饋式網絡和自組織網絡是常用的三種神經網絡模型,分別用於預測、聯想記憶和聚類等。

2軟件工程中數據挖掘技術的應用表現

2.1用於軟件項目管理方面

軟件項目的管理呈現出複雜化和系統化的特點,數據挖掘技術應用於軟件項目管理一方面表現在對組織關係的挖掘,比如公司舉辦年會等大型活動,在人員的分配上如果處理不好,就會出現混亂的局面,爲了實現人力資源的合理配製,往往採用數據挖掘技術來區分每個職員的職責,實現項目管理的有序化,提高了辦事效率;軟件項目管理中使用數據挖掘技術的另一個方面就是挖掘版本控制資訊,在此係統面臨外系統入侵時提出警告是數據挖掘技術所具備的功能之一,除此之外數據挖掘技術可以檢測該系統的修復情況,版本控制資訊的作用就是方便了人們對版本資訊的檢視,而數據挖掘技術的使用爲系統的安全執行提供了更有利的保障,使得軟件項目的管理水平逐步提高。

2.2漏洞的檢測時數據挖掘技術的使用

當數據挖掘技術用於檢測軟件的漏洞時,第一步要弄清楚要檢測什麼樣的軟件,第二步就是要制定合理的計劃,計劃的目的是爲了更好的對軟件進行檢測,不同軟件的構成和性質決定了檢測要採用不同的方式,緊接着就是對漏洞庫中的數據進行整理,對於不需要的數據進行清除,除此之外對於丟失的項目要採取措施補救回來,用數值表示來代替數據屬性。另外,要對合適的數據模型進行驗證,不同的項目會採取不同的方法,重要的是選擇合適的發掘方式來使其形成測試集,進而可以對全部的結果進行比較,透過比較找出最滿意的方式,數據挖掘技術的應用不見可以檢測漏洞還可以對未知的漏洞進行防護,並且把漏洞的`種類進行分析,整合出修復的方法,能使的在第一時間找出漏洞並進行修復,使得軟件能夠保持良好的性能,使其執行速度不至於減慢。

2.3挖掘程序代碼和結構中數據挖掘技術的使用

在挖掘程序代碼和結構方面比較常用的一種數據挖掘方法就是克隆代碼檢測法,該方法分爲度量、文字對比、程序結構和標識符對比這四種方法,四種方法各有各自的特點,具體的運用中需要考慮實際情況來確定到底使用那種方法。克隆代碼檢測通常會複製粘貼某一個代碼,在特殊的要求下,會根據需求來改正某些代碼,檢測這些代碼主要是爲了防止大面積出現故障,維護系統的安全,爲軟件執行提供一個可靠的環境。另一個常見的就是Aspect的挖掘,Aspect的挖掘就是常見說的橫切關注點挖掘。軟件工程中面向方面軟件的改造需要解決好Aspect的挖掘,雖然可以採用大量的方式來解決這個問題,但是最重要的方法之一就是度量分析法。

3數據挖掘技術在具體的使用中面臨的問題

3.1數據複雜化

目前的軟件工程數據主要包括結構化和非結構化兩類數據。非結構化數據包括軟件代碼,結構化數據則跟軟件的版本資訊有關,非結構化數據和結構化數據之間聯繫密切,因此在使用數據挖掘技術的時候,要對着兩種數據的關係進行考慮,這就增加了挖掘技術使用的難度。

3.2評價標準不一致

生產生活中很多領域都在使用數據挖掘技術,在使用後對它的結果也採取了一定的評價方法,但是往往這些方法不能一致,在軟件工程中也很難統一評價標準,因爲在軟件工程中出現的資訊一般比較複雜,而且往往透過不同的方法來表達,所以獲取者在進行資訊比較時候,面臨很大的苦難,所以導致不能準確的對數據挖掘結果進行分析。

4結論

總而言之,時代的發展越來越離不開數據挖掘技術的使用,這項技術很大程度上滿足了人們的需求,受到越來越多的重視,經過本文的論述之後,可以得知數據挖掘技術不僅使軟件工程更加完善,而且使人們學會用新的方式來獲得資訊,雖然書籍挖掘技術在實際的應用中會因爲軟件項目的數據複雜等原因會面臨一些挑戰,但是科技也在不斷進步,相信未來,數據挖掘技術會得到更廣泛的應用。

參考文獻

[1]陳建樺.數據挖掘技術在軟件工程中的應用研究[J].硅谷,2014(01):11-12.

[2]姚文濤.試論軟件工程中數據挖掘技術的應用[J].河南科技,2014(23):45-46.

[3]雷蕾.關於數據挖掘技術在軟件工程中的應用綜述[J].電子測試,2014(02):19-20.