當前位置:學問君>學習教育>畢業論文>

基於聯結主義的連續記分IRT模型的項目參數和被試能力估計

學問君 人氣:1.35W
基於聯結主義的連續記分IRT模型的項目參數和被試能力估計
基於聯結主義的連續記分IRT模型的項目參數和被試能力估計 1 問題的提出
  與經典測驗理論相比,項目反應理論(簡稱IRT)由於具有參數不變性、能進行計算機化自適應測驗等優點而受到歡迎,但是也存在着不少問題,首先是目前比較成熟的、得到廣泛應用的IRT軟件,如BILOG、MicroCAT等,主要是運用極大似然法或貝葉斯方法進行項目參數和被試能力估計,一般都只能處理二值記分的項目,也有少數軟件可以處理等級記分的項目,例如MULTILOG,但對於連續記分的項目還缺少估計方法和工具;其次是在運用BILOG、MicroCAT和MULTILOG等軟件時往往需要數百人的大樣本,而對於小樣本則缺少有效的估計方法,因此需要另尋途徑來解決這些問題。
    2 聯結主義理論中的級連相關模型
  聯結主義理論(或稱人工神經網絡)是近年來得到廣泛關注的認知心理學理論,它一方面可以用來模擬人的認知活動,探討人類的資訊加工機制,另一方面可以作爲一種工具來分析系統的輸入和輸出之間的關係,特別是當系統的輸入和輸出之間難以用顯性的數學方程表示時,聯結主義模型就可以透過其本身的學習功能,在用一組已知的輸入和輸出數據對它進行訓練以後,就可以在一定程度上掌握了該系統內部的輸入和輸出之間的關係,即建立了某種模型。如果我們再給這個經過訓練的網絡模型以新的輸入,那麼它就可以給出相應的輸出值。因此,人們可以利用聯結主義模型的這種性質來進行預測和參數估計等活動。
  聯結主義模型通常由一個輸入層、一個輸出層和若干個隱含層組成,每一層中含有若干個結點,一個模型中所含的隱含層數目和各層所含結點數目,是由具體問題的性質和複雜程度來確定的。各個結點之間的聯結具有一定的權重,它的大小反映了相鄰兩個結點之間相互影響的程度,在模型被訓練的過程中,各結點間的權重得到了調整。
  聯結主義模型通常可以分爲靜態型和動態型兩種,靜態型模型的拓撲結構是實驗者在一開始的時候就設計好的,它的訓練過程就是調節各結點之間的權重。動態型模型的拓撲結構是在訓練過程中不斷變化的,它能夠隨着訓練的進行,自動地加入新的隱含結點,同時也調整各結點間的聯結權重,這樣就可以更快地減少訓練誤差。
  級連相關模型是動態型聯結主義模型中的一種,它的計算精度較高,運算速度較快。在開始訓練時,該模型只有輸入層和輸出層,處於最小拓撲結構。隨着訓練過程的進行,它能夠根據需要自動地逐個加入隱含結點。該模型的訓練分爲輸出和輸入兩個階段交替進行,首先是輸出階段,在這一階段,模型對聯結隱含結點和輸出結點間的各權重進行調整,直到誤差不再減少爲止;然後轉至輸入階段,在這一階段,模型對於聯結輸入結點和候選隱含結點間的各個權重進行調整,並從中選出其輸出變量和網絡的誤差變量間相關爲最大的候選隱含結點,把它裝入網絡,這樣使得每次裝入的新隱含結點都能最大程度地影響誤差的變化。然後再轉至輸出階段,這個過程不斷重複,直到達到預定的訓練精度。在本研究中,由於無法事先確定模型的拓撲結構,以及爲了較快地對模型進行訓練和達到較好的訓練和測試效果,採用了級連相關模型作爲研究的工具。
    3 連續記分IRT模型
  連續記分IRT模型是二值記分IRT模型的擴展,即它的記分不是按照二值邏輯的全對或全錯的方式來進行,而是根據被試答對項目的程度來進行記分,如果全對該題目就得滿分。由於各題目的滿分值不一樣,有的是3分、5分、6分或更高的分數,爲了統一起見,可以對它們進行歸一化處理,全部轉化爲0至1的值。這樣就可以和下面的三參數邏輯斯諦模型中的P(θ)相一致。Samejima、Muller和Mullenbergh等都對連續記分IRT模型進行過研究,它和二值記分模型一樣,可以用正態卵形模型和邏輯斯諦模型表示。對於常用的三參數邏輯斯諦模型,它的表示式爲: