當前位置:學問君>學習教育>畢業論文>

Web數據挖掘在電子商務中的應用研究

學問君 人氣:2.22W
Web數據挖掘在電子商務中的應用研究
[摘要]當今互聯網擁有海量的數據,如何對這些Web上的數據進行挖掘提取有用的模式,輔助企業獲得成功,是一個刻不容緩的題目。本文對Web數據挖掘的基本內容和相應的技術作了先容,並對Web數據挖掘在電子商務中可應用的範圍作了說明。
  [關鍵字]Web數據挖掘、電子商務
  
   引言
  
   在電子商務領域,透過Web數據挖掘,不僅可以從大量多種多樣資訊的Web頁面中提取出我們需要的有用的知識,還可以得到關於羣體用戶訪問行爲和方式的普遍知識,用以改進Web服務設計。更重要的是,透過對用戶特徵的理解和分析,如對用戶訪問行爲、頻度、內容等的分折,提取出用戶的特徵,從而爲用戶定製個性化的介面,有助於開展有針對性的電子商務活動。[1][2]
  
   1.Web數據挖掘簡介
  
   當今Web上存在着大量的數據,獲取有用資訊成爲人們關注的焦點。但Web 是無結構的、動態的,Web 頁面極其複雜。這樣就使得人們從成千上萬的 Web 站點中找到有用的數據變得比較困難。於是,人們就越來越關注如何開發和利用 Web 上的數據資源。
   Web 數據挖掘就是解決上述題目的一個途徑。當數據挖掘技術應用於網絡環境下的 Web 中就成爲 Web數據挖掘。 Web數據挖掘就是從 Web 文檔和 Web活動中抽取感愛好的潛伏的有用模式和隱躲的資訊。
   Web挖掘可以分爲三類:Web內容挖掘、Web結構挖掘和Web使用挖掘 [3]。Web內容挖掘是用來提取文字、圖片或其他組成網頁內容成分的資訊;Web結構挖掘是用來提取網絡的拓撲資訊,即網頁之間的銜接的資訊;Web使用挖掘是用來提取關於客戶如何運用瀏覽器瀏覽和使用這些銜接的資訊。
  
   2.Web數據挖掘的技術先容
  
   從電子商務的角度出發,進行Web上的數據挖掘,主要就是進行客戶訪問資訊的挖掘,得到客戶端瀏覽行爲和訪問模式,從而找到有用的市場資訊。在Web數據挖掘的模式發現中,常有以下幾種數據挖掘技術的使用:
   2.1路徑分析:使用路徑分析技術進行Web使用模式挖掘,最常用的就是網站結構圖。它可以被用於判定在一個 web 站點中最頻繁訪問的路徑,還有一些其他的有關路徑的資訊透過路徑分析可以得出,比如:70%的用戶端在訪問/class/book2 時,是從/class 開始,經過/class/new, /class/book,/class/book1,最後纔到的/class/book2。這條規則說明在/class/book2 頁面上有有用的資訊,但由於客戶對站點進行的是迂迴繞行的訪問,所以這個有用資訊並不明顯。假如這個頁面對網站來說比較重要,可以透過此路徑分析改進頁面及網站結構的設計,從使客戶更輕易的訪問/class/book2。
   2.2關聯規則:關聯規則主要關注事物內的關係。在Web使用挖掘中,關聯規則挖掘就是挖掘出用戶在一個訪問期間從服務器上訪問的頁面/檔案之間的關係,找出在某一次服務器會話中最經常一起出現的相關畫面。例如,40%的.客戶再購買了CD之後又購買了CD清潔劑。利用挖掘出來的這些相關性,我們可以更好的組織站點,實施有效的市場策略。
   2.3序列模式:序列模式挖掘就是挖掘出交易集之間有時間序列關係的模式,在Web日誌中發現所有滿足用戶規定的最小支援度的大序列模式。序列模式的發現就是在時間戳有序的事務集中,找到那些“一些項跟隨另一個項”的內部事務模式。例如:在/class/book1上進行過在線定購的顧客,有60%的人在過往15天內也在/class/bag1處下過訂單。發現序列模式能夠便於進行電子商務的組織猜測客戶的訪問模式,對客戶開展有針對性的廣告服務。透過系列模式的發現,能夠在服務器方選取有針對性的頁面,以滿足訪問者的特定要求。
   2.4分類規則:分類技術主要是根據用戶羣的特徵挖掘用戶羣的訪問特徵。在Web數據挖掘中,分類規則的發現就是給出識別一個特殊羣體的公共屬性的描述,這個描述可以用來分類新的項,例如:在/class/book2 進行過在線定購的顧客中有 55%是20-30歲生活在南方的年輕人。得到這一分類後,就可以進行適合這一類客戶的商務活動。