下面內容是GRE分數的算法探究,節選自2016年1月北京新東方北美項目最新發布的《GRE年度報告》,歡迎閱讀。
GRE的算分一直是一個謎團。我們對於GRE分數的計算方式仍然停留在Official Guide中的描述。Official Guide中這樣說:
Your scores on the Verbal Reasoning and Quantitative Reasoning measures depend on your performance on the questions given. (考生文字推理和數量推理的成績取決於考生在所給定題目中的表現)
The Verbal Reasoning and Quantitative Reasoning measures are section-level adaptive. This means the computer selects the second section of a measure based on your performance on the first. Within each section, all questions contribute equally to the final score. For each of the two measures, a raw score is computed. The raw score is the number of questions you answered correctly. (文字推理和數量推理是以section爲單位的自適應的。這意味着計算機依據考生第一個section的表現來選擇第二個section。在每個section中,每個題目對最終分數的貢獻是一樣的。對於這兩種推力測試,首先一個裸分會計算出來,裸分就是答對題目的個數。)
The raw score is then converted to a scaled score through a process known as equating. The equating process accounts for minor variations in difficulty from test to test as well as differences in difficulty among individuals’ tests introduced by the section-level adaptation. Thus, a given scaled score reflects the same level of performance regardless of which section was administered and when the test was taken. (裸分再透過一個叫做equating的程序轉化成一個報道分數。這個equating的程序解釋了學生由於參加不同考試和不同的第二個section所帶來的難度上的差異。因此一個報道分數最終展現出了一個學生的能力表現,無論他考察的是哪個section)
從以上的描述中,我們知道一個學生的分數和兩個因素相關,分別是答對題目的個數和第二個section的難度係數。筆者試圖建立了幾個簡單的迴歸模型,基於現有的數據來討論分數與答對題目及其難度的關係。
考慮到在OG當中,GRE的分數主要取決於整體答對題目個數和第二個section的難度係數,筆者建立了一個簡單的`線性迴歸模型。
在數據中又添加了130分和170分兩個極端值的數據。
0表示非,1表示是
變量名稱 | 變量解釋
| |
Score | 學生GRE的Scaled Score | 130-170一個整數值 |
學生兩個section合在一起答對題目總數
| 第二個section是否爲medium模式
|
因此迴歸模型可以表達爲下述公式
Score = b1 + b2*right_number + b3*IsEasy + b4*IsMedium + e.
以下爲迴歸結果:
變量 | 係數 | 標準差 | p值 | |
right_number | 0.793 | 0.016 | 0.000 | |
IsEasy | -6.472 | 0.309 | 0.000 | |
IsMedium | -2.961 | 0.203 | 0.000 | |
_cons | 139.533 | 0.441 | 0.000 | |
觀測數量 | 137 | |||
R2 | 0.986 | |||
F | 3210.06 | |||
Prob>F | 0.000 |
該回歸結果的各項統計學指標都非常高,體現出模型對於學生GRE分數的解釋能力極強。從迴歸結果和我們之前的研究結論,我們可以整合得出以下結論:
(1) 我們假設學生第一個section答對13道題目,爲進入hard模式的最低標準,第二個section完全沒有答對題目,根據計算得出分數爲149.8分,因此hard模式的起評分爲150分,也就是說如果學生進入了hard模式,GRE分數一定會在150分以上。以此類推medium模式的起評分爲142分。
(2) 我們假設學生第一個section答對12個題目,剛好無法進入hard模式,而學生第二個section進入了medium模式並完全答對,則以此推測出進入medium模式的封頂分數爲162分。以此類推,進入easy模式的封頂分數爲154分。