淺析電子商務中的WEB數據的挖掘論文

學問君人氣：6.2K

[摘要] 本文立足於web數據挖掘技術，從個性化網站的設計、crm中的應用和推薦系統中的應用三個角度，分析了電子商務中的web數據挖掘應用。

[關鍵詞] 電子商務 web 數據挖掘

電子商務改變了人們傳統的商務模式，同時，也改變了商家與顧客之間的關係。客戶選擇餘地的擴大使得他們更加關注商品的價值，而不象以前首先考慮品牌和地理因素。因此對銷售商而言儘可能的瞭解客戶的愛好、價值取向，才能在競爭中立於不敗之地。數據挖掘技術可以有效地幫助銷售商理解客戶行爲，提高站點的效率。在電子商務網站的設計、客戶關係管理(crm)、網絡營銷等方面得到廣泛的應用。

一、數據挖掘在電子商務網站設計中的應用

數據挖掘可以得出諸如：什麼客戶喜歡這個站點、客戶透過什麼訪問路徑達成交易,以及客戶訪問站點的頻率等資訊，從而優化網站的結構提高網站的訪問量，吸引更多的客戶。對於改進網站設計、定製個性化頁面、判斷站點效率有着重要幫助。

利用web數據挖掘技術，個性化電子商務系統的實現過程包括資訊採集、資訊分析和個性化服務三個主要步驟：

1.資訊採集。收集客戶個人資訊是提供個性化服務的基礎。收集個人資訊主要有兩種方式。第一種方式是透過客戶註冊來獲得，這種方式可以得到客戶的性別、出生日期、最高學歷、家庭收入、婚姻狀況、職業等；第二種是透過客戶在網站上的行爲來判斷個人的興趣愛好等特點，從而獲得客戶個人資訊。如果客戶經常瀏覽某類產品或相關廣告，我們就可以知道客戶對這類產品感興趣。

2.資訊分析。一個成功和完善的個性化電子商務網站應該能夠在對客戶透明的情況下，對客戶的資料、行爲進行分析，並儘量不影響客戶的頁面處理時間，對於耗時較多的分析、分類處理應放在系統相對空閒和客戶退出網站等時間處理，減少客戶等待時間。資訊分析過程如下:(1)將網站客戶羣進行分類，然後按照客戶羣興趣特點進行內容設計，並且將內容相應歸類;(2)定義客戶類別所對應的內容，即某類客戶最需要看到什麼內容;(3)分析客戶的行爲和登入資料，判別客戶所屬的類別;(4)客戶瀏覽網站不同頁面時，以及提交購買定單時，修改相應行爲資料。

3.個性化服務。根據客戶類別顯示相應的內容給客戶，達到個性化服務的目的。爲了使分類更具有可信性和穩定性，對註冊時間較長，瀏覽及購買行爲相對穩定的客戶優先抽樣。

二、數據挖掘在crm中的應用

1.客戶的獲取。在大多數的'商業領域中，業務發展的主要指標包括新客戶的獲取能力。企業的市場部門人員可以採用傳統的方法來發展新客戶，如開展大規模廣告活動；也可以根據所瞭解的目標客戶羣，將他們分類，然後進行直銷活動。但是當數據量增大時，即使有豐富經驗的市場人員想要選擇出相關的人口調查屬性的篩選條件也會變得很困難，隨客戶數量不斷增長和每位客戶的細節因素增多，要得出這樣的行爲模式的複雜度也同樣增大。而數據挖掘技術可以幫助完成潛在客戶的篩選工作。首先從一份潛在的客戶名單開始，列出可能對企業的產品或服務感興趣的消費者的資訊，透過調查和處理對這些資訊進行數據擴展，並和一些外部資訊匹配，使之更適合數據挖掘分析。然後進行市場試驗活動，根據所需要預測的客戶行爲在一定範圍內對客戶進行試驗，記錄下客戶的反饋，稱之爲“反應行爲模式”。剔除無反應行爲和反應行爲類別中重複的數據後，在確定細節粒度的基礎上，利用數據挖掘技術構建出n元反應行爲預測模型。根據這個模型，可以將潛在的客戶排序，以便找出那些對企業的產品或服務最感興趣的客戶。

2.客戶的保持。隨着行業中的競爭愈來愈激烈和獲得一個新客戶的開支愈來愈大，保持原有客戶的工作也愈來愈有價值。在crm的實施中，企業透過預測，找出可能會流失的客戶，並分析出主要有哪些因素導致他們想要離開，在此基礎上，有針對性地挽留那些有離開傾向的客戶。

利用數據挖掘技術，可以透過挖掘大量的客戶資訊來構建預測模型，較準確地找出易流失客戶羣，並制定相應的方案，最大程度地保持住老客戶。數據挖掘技術中的決策樹技術能夠較好地應用在這一方面。

3.客戶的細分。細分是指將一個大的消費羣體劃分爲一個個細分羣體的動作，同屬一個細分羣的消費者彼此相似，而隸屬於不同細分羣的消費者被視爲不同的。透過crm的實施，將產生細分的客戶羣，企業根據客戶提出的要求和實際所做的不斷地改善產品和服務，從而使企業不斷提高使該客戶羣滿意的能力。

數據挖掘技術中的聚類分析技術能夠被運用來從客戶資訊數據庫中發現不同的客戶羣，並且用購買模式來刻畫不同客戶羣的特徵，達到細分客戶羣的目的。根據客戶數據特點，一般可採用聚類技術中的k平均算法來進行劃分。其原理爲將含原始客戶資訊的數據庫劃分成k個聚簇，然後採用一定的算法使得同一簇中的對象是“相似的”，而不同簇中的是“相異的”。

三、推薦系統中的數據挖掘技術

1.貝葉斯網絡。貝葉斯網絡技術利用訓練集創建相應的模型，模型用決策樹表示，節點和邊表示客戶資訊。模型的建立可以離線進行，一般需要數小時或數天，得到的模型非常小，對模型的使用非常快，這種方法適合客戶的興趣愛好變化比較慢的場合，推薦精度和最近鄰技術差不多。

2.關聯規則。關聯規則既可用來分析商品間的參考模式，也可以向客戶推薦商品，提高交叉銷售能力。關聯規則的發現可以離線進行，隨着商品數目的增加，規則的數量呈指數增加，但透過決策者對支援度和置信度的選擇，感興趣模式以及算法的選取，也可以高效實現。推薦精度比最近鄰技術略差。

3.聚類分析。該技術將具有相似愛好、購物興趣的客戶分配到相同的族中，聚類產生之後，根據該族中其他客戶對某商品的評價就可以得到系統對該商品的評價，聚類過程可以離線進行，聚類產生之後，性能比較好，但如果某客戶處於一個聚類的邊緣，則對該客戶的推薦精度比較低，推薦精度比最近鄰技術略差。

4.推薦系統要兼顧準確性和實時性。一個好的系統可能是多種方法和技術的結合，取長補短。譬如，可以把聚類分析作爲最臨近算法的預處理，即透過聚類分析來減小候選集，最臨近算法就可以在一個較小的數據集合中進行，從而提高了實時性。

參考文獻:

[1]周彥暉:電子商務與web數據挖掘.計算機應用.2006(5)

[2]董逸生:web挖掘研究綜述.計算機科學，2006(11)

TAGS：Web 電子商務論文淺析

最熱推薦

猜你喜歡

最近更新

更多推薦