可重複危機是如何形成的

學問君人氣：2.5W

你有聽說過可重複危機嗎?那麼可重複危機是怎麼形成的你又是否清楚呢?可重複危機是如何形成的是小編想跟大家分享的，歡迎大家瀏覽。

即使facebook和twitter上關於可重複危機的討論在心理學家之間已經吵翻了天，在國內也很見到討論。作爲一個萬年醬油黨，對這個領域的“熱點”還是一直在關注。大約四五年前，也曾與人爭論，心理學的研究到底是否可靠，也曾以問答的形式，介紹了當時剛剛“興起”的可重複危機。幾年之後，再來看這個問題，發現這個問題不僅沒有解決，反而引起了一波又一波更大的爭議和騷動。在心理學家之間，甚至引起了人身的攻擊(言語上的)。這是我作爲一個想要進入心理學學術界的年輕人所沒有想到的。

即然有問題，或者說很大一部分人覺得有問題，那麼，這個問題到底是什麼，如何解決這個問題，就成爲了這個領域的必須去面對的。

誠然，如許多人所提到的，可重複危機不是心理學一個領域的問題，許多其他領域也存在。但是，記得某位心理學家(忘記了出處和原話)：心理學是我們(心理學家)所唯一擁有的。所以，知道其他領域同樣存在可重複的問題，並不能是我們忽視這個問題的原因。

可重複性問題到底是從何時開始的?

作爲一個喜歡追蹤文獻、每週必看science和nature目錄的博士狗，“有幸”在這個危機開始的時候，圍觀了一系列在science和nature上被報道而引起廣泛關注的事件，在這裏把個人所瞭解的相關事件作一個回顧。

事件1：

Bem (2011)的預見未來的實驗。在這個標題爲“Feeling the future”的文章中，已經是知名社會心理學教授的Bem在人格與社會心理學的頂級期刊Journal of Personality and Social Psychology上指出：透過9個實驗，包括了1000多名被試，他發現了未來發生的事件，可能會影響到被試當前行爲反應。在這個頗具有預見性的討論中，他討論了統計方法、可重複性和這種預見未來現象的問題。當然，心理學界的人很快提出了質疑，兩個研究小組採用貝葉斯統計對他的數據進行了分析，表明無法從數據中得到這個推斷。更加晚一些重複實驗也沒有發現Bem的這個結果。此時，人們還無法預知，這個事件將成爲心理學可重複危機的一部分。science此時也只是用相當平淡的口吻給了一個評論：ESP paper rekindles discussion about statistics。

事件2：

到2011年年末，另一重磅事件，徹底讓人們開始反思心理學中方法的嚴謹性了。這就是Stapel的論文造假事件。Stapel本人是荷蘭Tilburg University社會心理學的教授，刻板印象方面的專家。2011年4月8號，也就是五年前的今天，他在science上發表一篇題爲 “Coping with Chaos: How Disordered Contexts Promote Stereotyping and Discrimination”的論文。這對於當時的我來說，實在是太有趣了：凌亂的環境居然會加重人們的刻板印象，太神奇了!對於這種有趣的研究，我很快在心理學與腦科學的論壇52brain.com上進行了傳播。但是到了2011年11月01日，Nature報道，Stapel的這篇論文涉嫌造假，標題是“Report finds massive fraud at Dutch universities”，而Science也撤回了此論文(2011.12.02)。此後，nature 和science都對這個事件進行了持續的關注。Stapel之所以能夠被發現是數據造假，是因爲他的研究生舉報。而Tilburg於2012年12月的調查報告顯示，在他職業生涯中發表的137篇論文中，有55篇數據完全是捏造的。此外，還包括他指導的10個博士生博士畢業論文中的數據。在另外10篇論文中，當時還無法斷定是否有造假行爲。Science在報道這個最終報告的時，提出一個事實：整個心理學領域都有無法推脫的責任(Final Report on Stapel Also Blames Field As a Whole)，因爲Stapel的55篇數據造假的論文中，審稿過程中完全沒有發現問題。而這並不是說審稿的過程是無法發現問題的，因爲在2012年，賓大沃頓商學院的Uri Simonsohn透過對Smeesters已經發表的兩篇論文結果進行了仔細的檢查之後，懷疑作者的數據有問題，隨後Smeesters所在的大學對其進行了調查，Smeesters聲稱自己由於某些客觀原因，原始數據丟失，但是其所在大學無法接受他的這個理由，接受了其辭職(見science的報道)。

事件3：

還是回到2011年，Simmons, Nelson, & Simonsohn 在psychological science上發表了一篇名爲False-Positive Psychology的論文，在這個論文中，指出了心理學研究中，有一些比較常見的做法會讓整個領域的假陽性過高。不過這個文章僅在學術界引起了一些關注，媒體的報道相對較少。

事件4：

2012年1月，無法重複的啓動研究。在中國的農曆尚未到2012年之時，社會心理學的社交網絡圈爆發了一個新聞：著名的老年啓動效應無法重複出來。記得在哈佛的幸福課(positive psychology)中，講課的老師就引用過這個研究，讓我印象深刻：當大學生看到一系列老年相關的詞彙之後，他們走出實驗室的速度會變慢，也就是說，變得更像老年人…….。當時我並沒有特別在意這個研究。但是2012年1月，開源雜誌Plos One發表了Doyen等人一個研究，聲稱無法重複出這個著名的效應。他們做了兩個實驗，第一個實驗完全重複Bargh等人的實驗，第二個則對參與實驗的人進行了某種暗示，再現了這個效應。對於這個結果，科普作者Ed Yong進行了報道，並且開頭引用了心理學教科書中著名的歷史安全“聰明的漢斯”的故事，暗示原作者們Bargh等在方法上的嚴謹性。正常情況下，這種無法重複的原因多種多樣，對於批評可能也無需太在意。但是Bargh作爲自動化加工(automatic process)方面的權威，面對這個研究和報道，表示非常憤怒，在自己的博客上進行了激烈的反擊，對重複實驗的作者、發表重複實驗的雜誌以及報道這個重複實驗的科普作者進行抨擊，語言比較激烈，後來刪除了該博客(可以從這裏和這裏找到當時其他博客上的一些引用)。正如其他資訊的傳播一樣，客觀理性的內容往往很難引起注意，但是充滿情緒的內容總是非常廣泛地傳播，於是Bargh的博客在社會心理學家之間傳播開來。

Bargh這個博客引起廣泛爭議的同時，應該說是再次讓社會心理學家們感受到了可重複問題的壓力。

於是一個原本不太受到對於的網站進入了大家的視野，這就是http://psychfiledrawer.org/。這個網站的目的是讓心理學家把自己未發表的數據上傳，以減少在論文發表中對陽性結果偏愛而陰性結果無法發表的這個問題。原本沒有人多少人關注這個網站，但是Bargh事件之後，許多人紛紛把自己重複過的數據上傳。更有意思的是，諾貝爾經濟學獎得主卡尼曼也站出來說話了。在題爲“A proposal to deal with questions about priming effects”的'郵件中，他老人家讓社會心理學家解決自己領域的問題。這個郵件內容也有不少的閱讀者。

事情發展到2012年，越來越多的重複失敗結果被曝光

要麼是在一些網站上公開數據，要麼是在一些學術期刊上發表。而對於Bem預見未來的實驗，也有重複實驗的報告在plos one上發表出來。心理學家也開始討論怎樣的重複才能算是一個合格的重複實驗。於是有了預先註冊(pre-register)、然後按照註冊的方法進行實驗，最後來報告結果。perspectives on psychological science上，也有專刊來討論可重複性的問題，這一次非常集中地討論了與可重複性相關的問題。同樣重要的是，2012年，John等人關於可疑研究操作(Questionable Research Practices)的調查報告發表，心理學家們承認，自己在研究的實踐中，一些通常的做法其實是大大地增加了假陽性的概率的。

直到2013年，Center for Open Science(COS)纔在Virginia University成立，心理學家纔有一個非正式的大規模的組織來應對這次可重複危機。COS搭建了開放科學框架的平臺(open science framework: osf.io/)，開始組織全世界的心理學家進行聯合的大規模重複實驗。這一年，perspectives on psychological science再次組織特刊討論了可重複性以及一些實驗方法上的問題。這一期中，Lebel將PsychDisclosure.org推出，提出了研究者要完整報告自己研究的方法部分的要求。

2014年，關於重複實驗應該如何做，研究者們基本上有一些共識，許多雜誌開始鼓勵提前註冊的重複實驗或者提前註冊。osf進一步完整，成爲一個可以公開註冊研究和分享數據的平臺。Journal of Experimental Social Psychology上，發表了題爲The Replication Recipe: What makes for a convincing replication?的文章。這一年，在social psychology這個雜誌5月的一期中，也發表了一系列經過提前註冊過的重複研究，能夠重複原先實驗結果的並不多。不過一個比較積極的消息是，由Klein等人發表的多實驗室項目(ManyLab)中，對心理學中經典研究的重複，大部分是有結果的。Cumming 也在psychological science上發表了題爲The New Statistics: Why and How的文章，指出需要在統計方法上進行變革。Psychological science也改變了其審稿的政策，對方法部分不再有字數的限制，開始啓用一些強制政策來加強方法部分的嚴謹性，如要求像Lebel指出的那樣報告方法部分四個方面的內容，使用效應量和置信區間等。其他的雜誌也有一些相應的調整。

2015年，最大的事件就是COS於2013年組織的大規模重複實驗的結果得以發表，許多人期待的結果在Science上發表，其結論是對100項研究的重複，大約39%能夠重複出來(根據對重複的標準不同，這個比例有一點變化)。這個研究的結果有大量的數據在osf.io上共享，供研究者去挖掘，而確實也有不秒研究者利用這些數據進行了後續的分析。許多人以爲，可重複危機基本上就已經確定了，心理學要開始進行艱苦卓絕的方法變革，來提高本領域研究的可重複性了。但是

2016年，Science上的一個評論再次引起爭議，Gilbert等人分析了COS大規模重複實驗的數據，認爲三個方面的錯誤使得他們的不足以得到心理學研究的可重複率只有39%的結論。這一評論再次激起了媒體以及心理學家對可重複性的討論甚至是論戰。然而，這些評論與爭議，也無法改變另一個非常著名的心理學效應在重複實驗前的倒下：自我損耗(ego-depletion)的重複實驗也未能重複出其效應，而元分析也顯示了相似的結果。這個失敗讓籠罩在心理學家頭上的烏雲更加密佈，因爲這個理論非常符合直覺，大量的心理學家投入時間和精力研究這個問題，大量的研究經費投入在這個問題的研究之中。不是一個人的問題，而是一羣人的問題!

TAGS：危機

最熱推薦

猜你喜歡

最近更新

更多推薦