當前位置:學問君>學習教育>畢業論文>

臨牀醫學中數據挖掘技術的運用分析

學問君 人氣:1.82W

數據挖掘技術的目的是找的未知的關係及數據擁有者能夠理解且有價值的新方法來總結數據,以下是小編蒐集整理的一篇探究數據挖掘技術運用分析的論文範文,歡迎閱讀參考。

臨牀醫學中數據挖掘技術的運用分析

【摘 要】醫院有着龐大的資訊資源系統,包括全面的管理資訊資料與臨牀資訊資料,這對於實現醫院管理的科學化現代化,對診療過程進行全面、動態跟蹤,進一步優化就診環境有着非常重要的作用,同時,不斷積累大量的臨牀資訊與管理資源。如何高效的應用這部分數據資訊資源,挖掘有價值、深層次的資訊,是擺在我們面前的重要研究課題。數據挖掘技術的有效運用,能夠進一步提高醫院管理水平與醫學技術。

【關鍵詞】臨牀醫學;數據挖掘技術;臨牀應用

隨着人工智能技術與數據庫技術的發展,數據挖掘應運而生。其不僅是一種新型的資訊技術,也是支援決策的過程體系,更好的爲決策提供資訊支援。現階段大部分醫院已經建立了自己的數據庫,但是,數據庫有效利用率比較低,僅限於查詢、錄入、修改等操作,缺乏對數據的分析與集成,更談不上知識的與醫學決策的自動獲取,數據挖掘的應用成爲臨牀醫學的重點。

1 簡要論述數據挖掘技術

數據挖掘技術[1]就是指從大量不完整的、隨機的、有噪聲模糊的數據裏提取出隱匿於其中人們所不知道卻又有潛在有用的資訊及知識的過程,簡而言之數據挖掘就是從各種數據中挖掘或提取資訊和知識。在資訊技術飛速發展的今天,數據收集及存儲技術的快速進步使各個組織機構得以積累大量的數據,面對如此龐大的數據量,現存的統計技術都遇到了各種各樣的問題,於是人們就開始對數據採取抽樣的方式收集資訊,這樣一來如何抽樣,抽多大樣本,怎麼評價抽樣效果,都是需要我們去研究的。

數據挖掘技術是將觀測到的龐大數據集加以分析研究,其目的是找的未知的關係及數據擁有者能夠理解且有價值的新方法來總結數據,經數據挖掘技術推匯出的關係及摘要常被稱爲模式或模型。數據挖掘技術的出發點就是替代專家從海量數據中找出隱含知識,它使數據儲存進入了一個新階段,它既有傳統數據庫的存儲功能,又能查詢歷史數據,找出其潛在的聯繫,挖掘出海量數據背後隱匿的重要資訊,這些資訊在決策生成中有重要參考意義,從而能更好地幫助人們做出正確的決策。

2 數據挖掘中常用的工具分析

作爲人工智能同數據庫技術結合下的產物,數據挖掘技術的很多方法都來源於機器的學習,所以模式識別,機器學習以及人工智能領域常規的技術例如決策樹、聚類分析、統計分析等方法在改進後都能用於挖掘數據。對醫學數據庫的數據挖掘,最重要的是對疾病的分類以及疾病預測。現階段牀用的挖掘工具有幾下幾種:

2.1 以統計分析爲基礎的數據挖掘法

數據挖掘技術裏非常多的實用工具都是以統計分析作爲基礎構造而成的,作爲一門比較成熟的分析數據的技術,統計技術在很多挖掘數據的工具中得到了充分的應用。

2.2 人工神經網絡法

作爲計算領域的重要技術,人工的神經元網絡技術[2]能根據管理模式或者非管理模式進行學習和研究,管理模式中的神經網絡要預測現有的示例可能造成的結果,並將預測到的結果同目標答案比較;非管理模式學習法對數據的描述很有效卻可以預測結果,而非管理模式裏的神經網絡創建了自己的合法性驗證及操作、類描述,無關於數據模式,神經網絡需要經歷相當的時間,同時由於它們像黑盒一樣的行爲會不能滿足資訊分析員的要求。

2.3 決策規則法與決策樹

決策規則法與決策樹就是一種解決在實際應用中的分類問題的方法,簡單的說,分類是使數據反映到一個事先定義好的.類中的函數過程,以一組輸入屬性值的向量或者相應類,歸納學習算法,然後得出分類。學習的目標就是要構建分類模型,根據屬性輸入值來預測實體的類。換言之,分類就是將一不連續標識值分到一個未標識的記錄中的過程,分類規則由於較直觀,因而易容於讓人接受,許多實施的決策樹在機器獲取領域中得到了有效算法。

2.4 進化的計算法

這是模仿了生物進化的一種計算方法的總稱,包括遺傳編程、進化規劃、進化策略及遺傳算法,它們一般具有下列特點;進化計算在函數的適度約束下進行智能搜尋,在目標函數的驅動下優勝劣汰,透過數次迭代逐步接近目標,因爲進化計算大都採用變異、雜交等的操作以擴大搜尋的範圍,所以其能接近全局的最優解,且具有框架式結構。一般在完成編碼及適應度函數選擇後,下面的遺傳、雜交及變異等操作都能自動完成。

3 臨牀醫學中數據挖掘技術的運用分析

3.1 疾病診斷

疾病診斷的準確性對於病人合理用藥指導以及康復指導非常重要。在臨牀醫學上,疾病類型多種多樣、致病原因錯綜複雜,透過數據挖掘技術的應用,能夠更好的進行臨牀診斷。在疾病診斷方面,模糊邏輯分析法、人工神經網絡、粗糙集理論等工具非常有效。我國學者[3]透過人工神經網絡分析法用於類風溼的臨牀診斷,臨牀診斷準確性大大提高。國外學者也透過人工神經網絡分析法用於實體性肺結節的臨牀診斷,準確率高達百分之百。在心血管疾病診斷中[4],應用模糊邏輯開發以及粗糙集理論,臨牀準確準確率高達93.5%。

3.2 分析疾病相關因素

在醫院資訊庫中,含有大量的患者個人資料以及病情資訊,包括患者的性別、年齡、生活情況等多方面資料,透過對數據庫中相關資訊的綜合研究與分析,可以得出有指導性意義的模式以及關係。疾病的發病原因、相關性危險因素分析,能夠有效指導此類疾病的預防。比如說,國外研究人員[5]運用數據挖掘技術成功分析了導致產科早產的三個危險性因素。

3.3 疾病預測分析

透過數據挖掘技術運用,能夠確定疾病的未來發展方向,結合患者的病史、臨牀症狀,分析、預測疾病的發展,從而有的方式的進行疾病預防。比如說,運用粗糙集分析方法,可以有預測疾病的發生。現階段,透過粗糙集理論預測疾早產準確率高達70%-90%,而人工預測準確性僅爲16%-35%。

3.4 在臨牀影像學中的應用

隨着醫學的不斷進步以及影像學的發展,在臨牀醫學中,影像圖像被越來越多的應用到臨牀疾病診斷中去。PET、MRI、CT等就是常用的疾病診斷工具。隨着數據挖掘技術的發展與應用,其在醫學圖像中逐漸應用,併發揮越來越重要的價值。西方學者[6]透過數據挖掘機是成功對SPECT心肌圖像進行了臨牀診斷分類。

【參考文獻】

[1]李曉毅s判別分析及其在疾病診斷中的應用[J].中國衛生統計,2011,21(6):356-357.

[2]網帥立,吳永明.數據挖掘技術在HIS中的應用探討[J].計算機應用與軟件,2012,20(4):248-249.

[3]姜興嶽,耿道穎.人工神經元網絡鑑別星形膠質細胞瘤良惡性的初步研究[J].中國醫學計算機成像雜誌,2011,27(2):186-187.

[4]劉革平,黃智興,邱玉輝.基於數據挖掘的遠程學習過程評價系統設計與實現[J].電化教育研究,2012,13(07):99-100.

[5]黃晶晶,倪天倪.分類挖掘在大學生智能評估系統中的設計與實現[J].計算機與現代化,2012,5(11):16-17.