當前位置:學問君>學習教育>畢業論文>

網絡讀者訪問流量統計分析系統的研究與實現

學問君 人氣:6.45K

1 前言

網絡讀者訪問流量統計分析系統的研究與實現

    隨着數字圖書館的建設,圖書館館藏資源數字化的快速發展,圖書館以網站的形式向讀者提供資訊資源的服務越來越多,這些服務有圖書館門戶、館藏資源檢索、光盤數據鏡像、電子書刊、網絡數據庫、自建數據庫和虛擬參考諮詢等等,爲了揭示網絡環境下讀者對這些資訊資源的瀏覽情況、閱讀情況以及訪問變化趨勢,準確瞭解讀者需求分佈和需求增長等情況,從而對網絡讀者的資訊資源尋求行爲模式進行研究,以便能爲讀者提供更好的服務,圖書館須瞭解以下幾個問題:網絡讀者是如何訪問網站的,這些資訊資源是如何被訪問使用的,如何評價這些資訊資源的利用情況等等。爲了回答這些問題,我們透過本系統對圖書館多個資訊資源發佈網站進行讀者訪問流量統計、熱點網頁訪問統計、讀者訪問來源統計析及各項專題訪問統計等研究,並根據統計結果反映的讀者需求分佈和需求增長等數據對信啓、資源網站的架構、介面的設計、發佈的內容加以修改和調整,以滿足讀者需求爲目標,吸引了讀者的目光,提高了圖書館資訊資源建設和服務水平。
    本系統透過對資訊資源的訪問記錄進行統計分析來了解讀者的資訊需求,這種量化的方法具有客觀和經濟的優點,還可配合調查研究法得到更實際的結果,並以此探討網絡資訊計量學在對資訊資源使用成效進行評估的應用,包括所遭遇的困難及應對之道,以期爲資訊資源的訪問評估與改進尋找可行的方法。

      2 系統的實現

    訪問量的多少是衡量網站是否成功的重要標準,但對於圖書館網站是遠遠不夠的,圖書館需要獲取完整的讀者訪問流量統計數據,來對圖書館資訊資源的使用情況進行分析,網絡資訊計量學方法是目前網絡界普遍採用的網站績效評估計量法,被認爲是可以用科學的方法檢驗網站訪問數據的一種工具。它的目的包括瞭解網絡讀者的行爲、確定網站是否吸引適當的讀者來訪、評定網站建設策略是否得當。其實施步驟可分爲三個階段:
    (1)記錄網站的訪問數據;
    (2)分析記錄數據;
    (3)爲網站建設策略的改進提供依據。
    2.1 系統原理
    由於網絡發佈站點和數據庫本身具備了訪問計量功能,各自的資訊資源收藏狀況便於人們掌握,並且能自動記錄讀者訪問的登入情況,如登入名、登入時間、瀏覽檔案、讀者的來源地址等,這些數據資料能夠準確反映讀者訪問資訊和來源分佈等情況,所以依據圖書館網絡讀者訪問統計的工作內容,制定相應的分析指標,並收集網絡讀者訪問圖書館資訊資源發佈站點形成的日誌檔案,然後利用日誌統計工作軟件定時對日誌檔案進行處理,得到統計數據,並動態生成各種表達形式的能滿足圖書館各項統計分析工作的報表。最後把生成的分析報表匯入到發佈數據庫中發佈出去。
    圖書館各個網絡資源站點建設人員可透過瀏覽網絡讀者訪問流量統計分析報告,分析和了解讀者的訪問需求,從而做好網絡資訊資源的建設工作。
    讀者行爲分析研究則可透過對分析報告進行質化研究,並結合一般調查法、諮詢研究法對讀者的資訊尋求行爲進行研究。
    本系統還可利用統計分析的結果來對系統自身工作進行評估和調整。
    2.2 分析指標
    傳統圖書館的分析指標和計量方法,雖然和數字化圖書館有很多不同,但使用的目的及計量的準則並沒有太大實質性差異[4]。
    參考傳統圖書館的分析指標以及國內外類似的研究結果選定了下列10個分析指標:
    (1)讀者到訪人數和潛在讀者人數的百分比;
    (2)到訪讀者表現了閱讀的興趣的百分比(採取明顯的閱讀行動);
    (3)可能的讀者轉爲經常的讀者的百分比(經常閱讀、下載資料);
    (4)讀者的持續度(重複到訪讀者);
    (5)讀者的忠誠度(網頁瀏覽次數、再度到訪的次數及時間長度);
    (6)讀者停止閱讀行爲的百分比(閱讀行爲半途中止);
    (7)讀者耗損率(現有讀者中停止閱讀行爲者的百分比);
    (8)讀者動搖率(耗損的讀者/到訪讀者的總數);
    (9)讀者最近到訪時間(據上次到訪的間隔時間);
    (10)讀者到訪頻率(多久到訪一次)。
    就此參數,我們可以從一個客觀的角度來觀察和評估圖書館網絡讀者訪問情況。
    2.3 系統框圖
    網絡讀者流量統計分析系統功能框圖
    2.4 工作方法
    本系統工作方法主要是採集網絡讀者訪問過程日誌進行量化分析法,它的優缺點見表1。
      讀者訪問過程日誌分析法優缺點
    量化分析法重視量的分析,本系統透過對訪問過程日誌以量的方法加以統計分析,首先根據爲了研究讀者需求分佈和需求增長情況這一目的將研究內容歸類成若干分析單元,接着將分析單元以數量的方式加以表達,進而以此爲解釋讀者資訊尋求行爲的依據。
    2.5 技術實現
    (1)系統結構
    本系統是以瀏覽器/服務器/數據庫體系結構作爲基本架構,透過ASP方式實現交互式、動態的讀者訪問日誌統計分析系統。系統結構框架如圖2所示:
   讀者訪問日誌統計分析系統結構框圖
    (2)系統組成模組
    本系統有六個模組組成:訪問日誌入庫、訪問流量分析、被訪頁面分析、來訪讀者分析和統計分析圖表。
    (3)系統執行環境與開發平臺
    本系統執行環境和開發平臺如表2。

    讀者訪問日誌統計分析系統模組
      表2 系統執行環境及開發平臺一覽表
軟件類別          軟件名稱
數據庫         SQL Server 2000+FastTrends Database