當前位置:學問君>學習教育>畢業論文>

Web數據挖掘及其在電子商務中的應用研究論文

學問君 人氣:2.71W

[摘要] 電子商務是現代商業模式,數據挖掘是先進的資訊處理技術,因此數據挖掘在電子商務中具有廣闊的應用前景。本文主要介紹了web數據挖掘的概念和分類,論述了電子商務中web數據挖掘的過程和方法,最後闡述了web數據挖掘技術在電子商務中的應用。

Web數據挖掘及其在電子商務中的應用研究論文

[關鍵詞] web 數據挖掘 電子商務

一、引言

電子商務是利用計算機技術、網絡技術和遠程通信技術,實現整個商務(買賣)過程中的電子化、數字化和網絡化。在全球範圍內,基於internet的電子商務迅猛發展,促使各企業經營者必須及時蒐集大量的數據,並且將這些數據轉換成有用的資訊,爲企業創造更多潛在的利潤。利用web數據挖掘技術可以有效地幫助企業分析從網上獲取的大量數據,提取出有效資訊,進而指導企業調整營銷策略,給客戶提供動態的個性化的高效率服務。

二、web數據挖掘

數據挖掘的概念

數據挖掘是指從數據庫中的大量數據中揭示出隱含的、先前未知的並有潛在價值的資訊的過程。web數據挖掘是數據挖掘技術在web環境下的應用,是從web文檔和web活動中發現潛在的、有用的模式或資訊。它是一項綜合技術,涉及到internet、人工智能、計算機語言學、資訊學、統計學等多個領域。

數據挖掘的類型

電子商務中web資訊的多樣性決定了挖掘任務的多樣性。按照web處理對象的不同,web數據挖掘可以分爲以下三種類型:

(1)web內容挖掘(web content mining):可分爲web頁面內容挖掘和搜尋結果挖掘。前者指的是對web頁面上的數據進行挖掘。而後者指的是以某一搜尋引擎爲基礎,對已搜尋結果的挖掘,以得到更精確有用的資訊。web內容挖掘常用的方法有weboql和ahoy。

(2)web結構挖掘(web structure mining):可分爲超連結挖掘、內容挖掘和url挖掘。整個web空間裏,有用的知識不僅包含在web頁面的內容之中,而且包含在頁面的結構之中。web結構挖掘是挖掘web潛在的連結結構模式,是對web頁面超連結關係、文檔內部結構、文檔url中的`目錄途徑結構的挖掘。page2rank方法就是利用文檔間連結資訊來查找相關的web頁。

(3)web使用挖掘(web usage mining):可分爲一般訪問模式挖掘和個性化服務模式挖掘。它是從web的訪問記錄中抽取感興趣的模式。/dianzijixie/">電子商務中,關聯規則的發現也就是找到客戶對網站上各種檔案之間訪問的相互聯繫。聯繫的問題就是得到如下形式的規則:“”, 其中與均爲在數據庫中相關數據特徵屬性值的集合。例如,用關聯規則技術,我們可以發現:如果客戶在一次訪問行爲中,訪問了頁面/page1時,一般也會訪問頁面/page2。進行web上的數據挖掘,構建關聯模型,我們可以更好地組織站點,減少用戶過濾資訊的負擔,實施有效的市場策略,增加交叉銷售量。

4.序列模式(sequential pattern)

序列模式分析的目的是爲了挖掘出數據間的前後或因果關係,就是在時間戳有序的事務集中,找到那些“一些項跟隨另一個項”的內部事務模式。例如,在/page1上進行過在線訂購的顧客,有60%的人在過去10天內也在/page2上下過定單。透過序列模式的發現,能夠便於電子商務的經營者預測客戶的訪問模式,在服務器方選取有針對性的頁面,以滿足訪問者的特定要求;網站的管理員可將訪問者按瀏覽模式分類,在頁面上只展示具有該瀏覽模式的訪問者經常訪問的連結,而用一個“更多內容”指向其他未被展示的內容。當訪問者瀏覽到某頁面時,檢查他的瀏覽所符合的序列模式,並在顯眼的位置提示“訪問該頁面的人通常接着訪問”的若干頁面。

5.分類規則(classification regulation)

分類要解決的問題是爲一個事件或對象歸類。設有一個數據庫和一組具有不同特徵的類別(標記),該數據庫中的每一個記錄都賦予一個類別的標記,這樣的數據庫稱爲示例數據庫或訓練集。分類分析就是透過分析示例數據庫中的數據,爲每個類別做出準確的描述或建立分析模型或挖掘出分類規則,然後用這個分類規則對其它數據庫中的記錄進行分類。例如,經過web挖掘發現,在/page1進行過在線訂購的客戶中有60%是20歲~30歲生活在大中城市的年輕人。得到分類後,就可以針對這一類客戶的特點展開商務活動,提供有針對性的個性化的資訊服務。用於分類分析的方法有統計方法的貝葉斯分類、機器學習的判定樹歸納分類、神經網絡的後向傳播分類、k-最臨近分類、mbr、遺傳法、粗糙集和模糊集等。

6.聚類分析(clustering analysis)

聚類分析不同於分類規則,其輸入集是一組未標定的記錄,也就是說,此時輸入的記錄還沒有進行任何分類。其目的是根據一定的規則,合理地劃分記錄集合,並用顯式或隱式的方法描述不同的類別。在電子商務中,透過聚類具有相似瀏覽行爲的客戶,可使經營者更多地瞭解客戶,爲客戶提供更好的服務。例如,一些客戶在一個時間段內經常瀏覽“wedding celebration”,經過分析可將這些客戶聚類爲一組,並可進一步得知這是一組即將結婚的客戶,對他們的服務就應該有別於其他的聚類客戶,如“經理人員階層組”、“學生階層組”。這樣,web可自動給這個特定的顧客聚類發送新產品資訊郵件,爲這個顧客聚類動態地改變一個特殊的站點。在一定程度上滿足客戶的要求,這對客戶和銷售商來說更有意義。

三、web數據挖掘技術在電子商務中的應用

1.挽留老顧客,挖掘潛在客戶

透過web挖掘,電子商務的經營者可以獲知每位訪問者的個人愛好,充分地瞭解客戶的需要,根據每一類顧客的獨特需求提供定製化的產品,並根據需求動態地向客戶做頁面推薦,調整web頁面,提高客戶滿意度,延長客戶駐留的時間,最終達到留住客戶的目的。透過挖掘web日誌記錄,可以先對已經存在的訪問者進行分類,然後從它的分類判斷出某個新客戶是否是潛在的客戶。

2.制定產品營銷策略,優化促銷活動

透過對商品訪問情況和銷售情況進行挖掘,企業能夠獲取客戶的訪問規律,確定顧客消費的生命週期,根據市場的變化,針對不同的產品制定相應的營銷策略。

3.降低運營成本,提高企業競爭力

電子商務的經營者透過web數據挖掘,可以得到可靠的市場反饋資訊,認真分析顧客的將來行爲,進行有針對性的電子商務營銷活動;可以根據關心某產品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率,從而降低運營成本,提高企業競爭力。

4.提高站點點擊率,完善電子商務網站設計

透過挖掘客戶的行爲記錄和反饋情況爲站點設計者提供改進的依據,進一步優化網站組織結構以提高網站的點擊率。比如利用關聯規則的發現,可以針對不同客戶動態調整站點結構,使客戶訪問的有關聯的檔案間的連結更直接,讓客戶容易地訪問到想要的頁面,就能給客戶留下好的印象,增加下次訪問的機率。

同時對網站上各種數據的統計分析有助於改進系統性能,增強系統安全性,並提供決策支援。

四、結束語

當今時代,電子商務的發展勢頭越來越強勁,面向電子商務的數據挖掘將是一個非常有前景的領域。但是,不可否認,在面向電子商務的數據挖掘中還存在很多急需解決的問題, 比如:怎樣將服務器的日誌數據轉化成適合某種數據挖掘技術的數據格式;怎樣解決分佈性、異構性數據源的挖掘問題;如何控制整個web上的知識發現過程等。

參考文獻:

[1]jiawei han,micheline kamber著,範明孟小峯譯:數據挖掘概念與技術.機械工業出版社,2001,8

[2]凌傳繁:web挖掘技術在電子商務中的應用[j].情報雜誌,2006,(1)

[3]柳:web挖掘技術與電子商務[j].商場現代化,2007,(03x)