當前位置:學問君>學習教育>畢業論文>

淺談數據挖掘技術在電子商務中的應用

學問君 人氣:1.31W

摘要: 概述了數據挖掘的定義、方法、過程,論述了數據挖掘技術電子商務的關係,提出了數據挖掘技術在電子商務系統中應用的體系結構,經過測試,達到了預定的結果。

淺談數據挖掘技術在電子商務中的應用

關鍵詞: 數據挖掘 電子商務 應用

當今,國內外電子商務類網站日益興起。許多電子商務類網站都提供了一定程度的個性化服務,比如提供商品推薦服務。而構成這些個性化服務的基礎就是數據挖掘技術。

一、數據挖掘分析

1.數據挖掘的定義。數據挖掘 (data mining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的但又是潛在有用的資訊和知識的過程。包括存儲和處理數據, 選擇處理大數據集的算法、解釋結果、使結果可視化。

2.數據挖掘的方法。從商業的角度來看,數據挖掘是一種新的商業資訊處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據。數據挖掘的方法大致可以分成4類:關聯分析、概括分析、分類分析、聚類分析。(1)關聯分析:分析表面上不相關數據之間的內在聯繫,揭示各事之間的`依賴性和相關性,分析範圍包括簡單關聯、因果關聯等。在電子商務中,用數據挖掘找到隱藏的關聯規則,當客戶瀏覽、搜尋關聯規則中的某種商品時,就可以在頁面中以推薦商品的形式顯示關聯規則中的其它商品。在進貨計劃和促銷計劃中,也可以將這個因素考慮進去。(2)概括分析:即提取數據庫中指定的數據集合的一般特性,找出遍性規律。(3)分類分析:設定分類規則,把各個事務或實體按照性質和特徵不同進行歸類,把數據層次化和規整化,從而建立數據的分類模型。(4)聚類分析:透過分析和歸納實體之間的特徵差異,選出具相識特徵的實體聚合成爲一個類,並用某種規則來描述該類的相同屬性,形成一種聚類規則,實際上,它是與分類分析法互逆的過程。

3.數據挖掘的過程。該過程從大型數據庫中挖掘先前未知的、有效的、可實用的資訊,並使用這些資訊做出決策或豐富知識。(1)確定業務對象:清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最後結構是不可預測的,但要探索的問題應是有預見的,爲了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。(2)數據準備。數據的選擇:搜尋所有與業務對象有關的內部和外部數據資訊,並從中選擇出適用於數據挖掘應用的數據。(3)數據挖掘:對所得到的經過轉換的數據進行挖掘。除了完善從選擇合適的挖掘算法外,其餘一切工作都能自動地完成。(4)結果分析:解釋並評估結果。其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術。(5)知識的同化:將分析所得到的知識集成到業務資訊系統的組織結構中去。

二、數據挖掘與電子商務的關係

在電子商務企業中,數據挖掘運用於客戶行爲分析,企業從中受益體現在以下四個方面:(1)可以發現客戶和訪問者的愛好、生活模式。(2)可以爭取新顧客,怎樣使產品適銷對路、怎樣給產品定價、怎樣吸引單個客戶、怎樣優化Web網站。(3)可以用相應的資訊確定顧客的消費週期,針對不同的產品制定相應的營銷策略。(4)可以確定客戶細分,爲每一個客戶的獨特需求設計“量身定製”的產品。

三、數據挖掘技術在電子商務中的應用

1.面向電子商務的數據挖掘系統設計。本系統電子商務平臺採用基於三層體系結構構建,服務器端採用先進的J2EE平臺構架,有完整的體系框架組成,具有很好的可擴展性、互聯性和可維護性。因此面向電子商務的數據挖掘系統由數據庫服務器、應用服務器和客戶端三層組成,整個體系結構是以J2EE企業級的構建技術爲基礎。對數據挖掘過程中產生的數據,採用獨立的數據挖掘庫表存放,這樣既不影響也不依賴數據挖掘的數據源。應用服務器完成所有的數據挖掘運算,透過接受客戶端的設定,完成所有對數據進行探索、轉換、挖掘的工作。數據挖掘系統的每個功能模組都以EJB的形式進行封裝,以實現分佈式計算和負載平衡等分佈式計算的要求,把具有繁重計算任務的模組和用戶交互模組分開。客戶端要負責數據挖掘流程的創建工作、所有功能模組參數的設定以及各種可視化結果的顯示。用戶可以根據自己的要求任意創建各種形式的挖掘流程,同時按照需要執行某部分流程,獲取相應的可視化分析結果,其系統體系結構如圖所示。

2.面向電子商務的數據挖掘系統功能設計。面向電子商務的數據挖掘系統主要以下幾大功能模組:(1)用戶資訊分析。運用分類和聚類挖掘方法對用戶的資訊分析,可以得到用戶的些特徵。對用戶分類相當於對具有某些公共屬性的用戶羣體建立了概要特徵描述,這些特徵可以用來對新增的用戶進行分類,可以發現未來的潛在用戶並開展有針對性的商務活動,如自動給一類特定的用戶發送銷售郵件,當屬於同一類的用戶再次訪問站點時爲其動態地改變站點的內容等。透過這些舉措使商務活動能夠在一定程度上滿足用戶的要求,實現目標營銷。(2)商品資訊分析。運用關聯規則挖掘發現商品訪問中所有關聯和相聯繫的規則,可以從交易事務數據庫中發現商品間的相互聯繫。這對電子商務公司組織站點網頁結構、開展有效的營銷策略非常有幫助。(3)物流資訊分析。採用神經網絡預測技術,根據各物流配送點接到的網站用戶訂單來預測其庫存數量。預測資訊可以給物流配送中心以參考,用來合理地確定各配送點倉庫的庫存量,使各配送點的補貨能更加合理有序,降低物流成本,節約庫存費用。

四、結束語

數據挖掘是一個新興的領域, 具有廣闊應用前景,目前,電子商務在我國正處於快速發展和應用階段,利用數據挖掘技術,能夠強化對客戶的服務、促進市場最優化、加速資金週轉、實現企業的創新發展。電子商務平臺上的數據挖掘技術有待人們去進行更深入的研究工作,這將不斷的推動數據挖掘技術的深入發展和廣泛應用,創造出更多的社會和經濟價值。