當前位置:學問君>學習教育>論文寫作>

論文寫作數據處理常犯錯誤分析

學問君 人氣:2.23W

醫學論文的寫作無可避免的會用到數據,數據涉及統計,對於醫學論文中的數據統計不是每個人都知道怎麼去運用,下面是小編蒐集整理的論文寫作數據處理常犯錯誤分析,供大家閱讀參考。

論文寫作數據處理常犯錯誤分析

1. 統計結論的描述不確切

數理統計的基礎是概率論,對統計分析的資料下結論的依據是小概率事件在一次試驗中是不可能發生的。一般統計上習慣把概率P≤0.05或P≤0.01認爲是小概率事件。

一般統計上說的“差異顯著”(P≤0.05),“差異非常顯著”( P≤0.01)是統計學的術語,它不同於一般意義上的“顯著”概念。

爲了不至於混淆這兩者的概念,現在統計學上主張用差異無顯著意義或無統計意義、差異有顯著意義或有統計意義、差異有非常顯著意義或高度統計意義來代替以前常用的“差異不顯著”、“差異顯著”和“差異非常顯著”。

下結論時,不僅根據統計學的結論,還要根據專業知識來判斷。有的人只憑少量的統計資料就作出“有差異”、“無差異”的判斷,並對所調查的數據下結論,是不科學的。而“有差異”、“無差異”這樣的說法也是不對的。

例如調查吸菸者與不吸菸者的慢性氣管炎的患病情況(P<0.01),只能說明吸菸者與不吸菸者患慢性氣管炎差異有非常顯著性意義,即吸菸者更容易患慢性氣管炎,至於兩者患病率相差是否顯著,要結合專業知識來判斷,而不能說非常顯著。

2.統計指標的誤用

在來稿中,經常遇到統計指標的誤用,常出現率與構成比,發病率與患病率,死亡率與病死率等的混淆。

2.1把構成比當率。構成比是說明事物或現象內部各構成部分的比重,率爲表示某種現象發生的頻率或強度。它們都是相對數指標,用百分數表示。有一篇題爲“某年某地5類傳染病疫情分析”,該文作者認爲,5類傳染病的發病率依次爲痢疾48.62%(3685/7579)、肝炎27.85%(2111/7579)、乙腦11.22%(850/7579)、流腦6.89%(522/7579)、麻疹5.42%(411/7579)。該資料是構成比,不是發病率,故犯了“以比代率”的錯誤。

2.2發病率與患病率。發病率是指觀察期內(年、季、月等)新發生某病的例數與同期平均人口數之比,強調在觀察期內的新發病例數。而患病率則指觀察時點的某病的現患病例數與該時點人口數之比,強調的是該觀察時點上某病的現患(新、舊病例)情況。有人調查男性7674人,沙眼患者6235人,發病率爲81.25%;女性調查2896人,沙眼患者2225人,發病率爲76.83%。這顯然是錯誤的,應該是患病率。發病率是指平均每1000人口中新發生的病例數。其計算公式爲:某病發病率等於某年(期)內所發生的新病例數除以同年(期)平均人口數乘1000‰。例如某地某年年平均人口數爲2500人,白喉發病28人,該地白喉年發病率爲11.20‰。

3.對照設計不合理

“有比較纔能有鑑別”,設立對照組是爲了科學地鑑別。醫學科學研究設立對照尤爲重要。一些科研論文科學性不強的主要原因是對照不合理,甚至有的根本不設對照組。臨牀上不少疾病,都有一定的自愈率,病情自行緩解的現象更爲普遍,影響疾病過程的因素就更爲複雜,除治療因素外,精神、環境、休息、營養、氣候等都對疾病發生影響。如果不透過嚴格對照試驗,很難作出正確判斷。

4.樣本選擇不當

樣本的選擇要符合隨機化的原則,這樣才能使樣本客觀地反映總體。在來稿中我們發現不少作者對隨機化分組的意義和方法不夠了解,有的交待了隨機抽樣,而沒有交待抽樣和分配的具體方法;有的雖知道隨機化分組的原則,但因怕麻煩,而沒有認真執行;有的甚至爲了提高論文的刊用率,而冠以隨機化的字眼。爲解決上述問題,編輯部在審稿時要求作者補充研究對象隨機化抽樣和分配的具體方法。前者如單純隨機抽樣、系統抽樣、分層抽樣、整羣抽樣等;後者如完全隨機化設計、配對設計、配伍設計、拉丁方設計、序貫設計、正交試驗設計等。

5. 隨機分組不均衡

對照組與試驗組必須遵循均衡化的'原則,也就是說對照組除了缺少實驗處理因素外,其它條件應與實驗組基本一致,從而排除非處理因素對結果的影響。如果分組時未注意到對照組與實驗組的均衡關係,那麼對照組與實驗組就會出現差異,使實驗的可比性減少,統計學意義下降。

6. 非參數不能用參數統計方法

對計量資料的統計數據經常用t檢驗或F檢驗,但也經常出現把非參數計量資料的數據用參數統計方法進行處理。如微量元素(血鉛、血鋅、尿汞)等數據經常出現偏態分佈[3]。當數據呈偏態分佈時小樣本(n<50)不能用參數統計方法(t檢驗或F檢驗),而應該用非參數統計方法(參比差值法或秩和檢驗)或進行數據轉換(倒數或對數)後用參數統計方法。

7.統計表圖不規範

在疾病防治中,我們使用大量的統計表圖,以闡說疾病發生髮展的客觀規律,評價防治措施的效果。正確的統計表應該是簡單、明瞭,能夠說明各統計量之間關係和差異的三線式統計表。不宜過繁、過多,不能把幾種不同性質的統計量羅列到同一表格內。

8.統計方法的選擇與使用不正確

選用統計方法之前應首先確定是計數資料還是計量資料。

計數資料是先將觀察單位按性質或類別進行分組,然後清點各觀察單位的個數所得的資料,如根據治療結果計算出的治癒率、有效率、病死率、陽性率等。

計量資料是對每個觀察單位用定量方法測定某項指標數值大小所得的資料,如身高、體重、脈搏、血壓、濃度、白細胞總數等。計數資料最常用的統計方法爲χ2檢驗或U檢驗,計量資料最常用的統計方法爲t檢驗(或F檢驗),但在來稿中時有發生相互混淆。

另外,應用t檢驗的條件是:①當樣本含量較小時,要求樣本符合或近似正態分佈;②當兩樣本均數比較時,兩樣本方差相等;③當樣本不符合正態分佈時,應採用t’檢驗代替t檢驗;④當兩樣本方差不等時,應採用秩和檢驗或t’檢驗。有的作者在使用t檢驗時未考慮到上述因素而盲目使用。對於等級資料(如治癒、顯效、好轉、無效)要比較療效只能用非參數檢驗。