統(tǒng)計(jì)中p值怎么計(jì)算 p值如何計(jì)算

點(diǎn)擊上面，盡在AI中國。
每個(gè)數(shù)據(jù)科學(xué)家都會(huì)遇到這樣一個(gè)問題，什么是P值，我們?nèi)绾卧诮y(tǒng)計(jì)分析中使用它？
每個(gè)數(shù)據(jù)科學(xué)面試中至少有一個(gè)問題是關(guān)于P值及其目的的。所以，在這篇文章里，我將討論P(yáng)值的語境、過程和目的。對統(tǒng)計(jì)檢驗(yàn)、置信區(qū)間和統(tǒng)計(jì)能力的錯(cuò)誤解讀和濫用已經(jīng)被譴責(zé)了幾十年，但仍然猖獗。因?yàn)檫@些概念需要高度和時(shí)間，這種高認(rèn)知需求導(dǎo)致捷徑定義和解釋的流行，這些定義和解釋是完全錯(cuò)誤的，有時(shí)甚至是災(zāi)難性的。然而，這些誤解在大多數(shù)科學(xué)文獻(xiàn)中占主導(dǎo)地位。
統(tǒng)計(jì)數(shù)字
在統(tǒng)計(jì)測試的大多數(shù)應(yīng)用中，模型中的一個(gè)假設(shè)是特定的影響具有特定的大小，并且已經(jīng)成為統(tǒng)計(jì)分析的目標(biāo) 。這種有針對性的假設(shè)稱為研究假設(shè)或檢驗(yàn)假設(shè) ，用來評(píng)價(jià)它的統(tǒng)計(jì)方法稱為統(tǒng)計(jì)假設(shè)檢驗(yàn) 。最常見的是，目標(biāo)效應(yīng)的大小是一個(gè)“空”值，表示零效應(yīng)(例如，研究處理對平均結(jié)果沒有影響) 。在這種情況下，檢驗(yàn)假設(shè)稱為零假設(shè) 。但是，也可以測試其他效果。我們還可以檢驗(yàn)假設(shè)效應(yīng)是否屬于特定范圍；比如，我們可以檢驗(yàn)效應(yīng)不大于一定量的假設(shè) 。在這種情況下，假設(shè)被認(rèn)為是片面假設(shè) 。
很多統(tǒng)計(jì)學(xué)教學(xué)和實(shí)踐都形成了一種強(qiáng)烈的(也是不健康的)焦點(diǎn) ，即研究的主要目的應(yīng)該是檢驗(yàn)零假設(shè) 。其實(shí)大部分統(tǒng)計(jì)檢驗(yàn)的描述僅限于檢驗(yàn)零假設(shè) ，整個(gè)題目叫做“空假設(shè)顯著性檢驗(yàn)” 。零假設(shè)的這種排他性會(huì)導(dǎo)致對檢驗(yàn)的誤解。更具誤導(dǎo)性的是，許多作者使用“零假設(shè)”來指代任何測試假設(shè) ，即使這種用法與其他作者不一致，并且在通用英語中被定義為“無效” 。
更精確的統(tǒng)計(jì)分析的目標(biāo)是提供對影響的確定性或不確定性的評(píng)估。我們用假設(shè)的“可能性”來表達(dá)這種確定性。但是，在傳統(tǒng)的統(tǒng)計(jì)方法中， “概率”并不是指假設(shè) ，而是指在假設(shè)的統(tǒng)計(jì)模型下，數(shù)據(jù)模式的假設(shè)頻率的個(gè)數(shù) 。這些方法因此被稱為頻率論方法，其預(yù)測的假設(shè)頻率被稱為“頻率概率” ，而不是假設(shè)概率(誤解) 。
p值
假設(shè)頻率稱為P值，也稱為檢驗(yàn)假設(shè)的“觀察顯著性水平” 。p值和統(tǒng)計(jì)顯著性的傳統(tǒng)定義圍繞著零假設(shè) ，我們把所有其他用來計(jì)算p值的假設(shè)都視為完全正確。由于我們不確定這些假設(shè) ，我們將學(xué)習(xí)更一般的P值視圖，這是對觀察數(shù)據(jù)和我們預(yù)測或期望看到的數(shù)據(jù)之間的兼容性的統(tǒng)計(jì)總結(jié) ，如果我們知道整個(gè)統(tǒng)計(jì)模型是正確的。
測試統(tǒng)計(jì)(如T統(tǒng)計(jì)或卡方統(tǒng)計(jì))用于測量數(shù)據(jù)和模型預(yù)測之間的距離。如果每個(gè)模型假設(shè)都是正確的，包括檢驗(yàn)假設(shè) ，那么P值就是所選檢驗(yàn)統(tǒng)計(jì)量至少與其觀察值一樣大的概率。這一定義反映了傳統(tǒng)定義中丟失的一個(gè)關(guān)鍵點(diǎn):在邏輯上， P值測試所有關(guān)于數(shù)據(jù)如何生成的假設(shè)(整個(gè)模型) ，而不僅僅是它應(yīng)該測試的目標(biāo)假設(shè)(如零假設(shè)) 。
通過獲得一個(gè)更小的p值，我們可以說，如果所有的假設(shè)都是正確的，那么數(shù)據(jù)將更加不尋常；但是一個(gè)非常小的p值并不能告訴我們關(guān)于假設(shè)有效性的任何事情。我們舉個(gè)例子。當(dāng)P值因?yàn)榧僭O(shè)的目標(biāo)而非常小時(shí) ，可能是因?yàn)檫`反了研究方案而很小，也可能是用不正確的數(shù)據(jù)分析的。相反，較大的p值表明數(shù)據(jù)在統(tǒng)計(jì)模型下并不罕見，但它并沒有告訴我們關(guān)于模型的有效性和假設(shè)的任何事情。由于違反了研究協(xié)議，它可能非常大，或者它可能使用不正確的數(shù)據(jù)進(jìn)行分析，或者只是為了表達(dá)的目的而提出有效的觀點(diǎn) 。
建立一個(gè)好的統(tǒng)計(jì)模型最好的方法是計(jì)算置信區(qū)間，現(xiàn)在很多期刊都需要這個(gè) 。
【統(tǒng)計(jì)中p值怎么計(jì)算 p值如何計(jì)算】這種對檢驗(yàn)中無效假設(shè)的關(guān)注，不僅會(huì)導(dǎo)致對檢驗(yàn)和估計(jì)值評(píng)價(jià)的誤解，還會(huì)掩蓋P值和置信區(qū)間之間的密切關(guān)系，以及它們共同的弱點(diǎn) 。

統(tǒng)計(jì)中p值怎么計(jì)算 p值如何計(jì)算

推薦閱讀

如何找尋自我

縫紉機(jī)調(diào)線器怎么安裝平車方法如何

強(qiáng)組詞強(qiáng)字組詞

火筍雞翅的做法（增肥食譜）

閨女生日快樂祝福語朋友圈

LV請來潮牌設(shè)計(jì)師做藝術(shù)總監(jiān)，看中的是啥

老虎豆怎么做好吃老虎豆圖片怎樣弄來吃

暖氣有流水聲是什么原因

皮球是什么體

手機(jī)怎樣開通QQ空間

男生發(fā)mua說明 mua是什么意思

手指蓋凹陷怎么回事

對自己的生活失去掌控咋調(diào)整

小米10s怎么沒有月亮模式

我想找個(gè)偏僻的地方搞養(yǎng)殖！有沒有推薦的地方？

南京養(yǎng)老金認(rèn)證上門服務(wù)怎么申請南京市養(yǎng)老金認(rèn)證

如何評(píng)價(jià)豬場閹割豬？

最后一個(gè)字是豹的成語

泰山散酒怎么樣

貓發(fā)情的聲音(貓發(fā)情的叫聲)