91精品国产手机在线-白筒袜嫩萝双腿之间乳白液体-青青操手机在线视频观看-日本中文字幕人妻日韩-日韩精品在线观看视频网站-天堂资源中文最新版在线一区-欧美专区一区二区三区-国产综合亚洲欧美在线-国产精品久久久久久福利69堂

統(tǒng)計(jì)中p值怎么計(jì)算 p值如何計(jì)算

點(diǎn)擊上面 , 盡在AI中國 。
每個(gè)數(shù)據(jù)科學(xué)家都會(huì)遇到這樣一個(gè)問題 , 什么是P值 , 我們?nèi)绾卧诮y(tǒng)計(jì)分析中使用它?
每個(gè)數(shù)據(jù)科學(xué)面試中至少有一個(gè)問題是關(guān)于P值及其目的的 。所以 , 在這篇文章里 , 我將討論P(yáng)值的語境、過程和目的 。對統(tǒng)計(jì)檢驗(yàn)、置信區(qū)間和統(tǒng)計(jì)能力的錯(cuò)誤解讀和濫用已經(jīng)被譴責(zé)了幾十年 , 但仍然猖獗 。因?yàn)檫@些概念需要高度和時(shí)間 , 這種高認(rèn)知需求導(dǎo)致捷徑定義和解釋的流行 , 這些定義和解釋是完全錯(cuò)誤的 , 有時(shí)甚至是災(zāi)難性的 。然而 , 這些誤解在大多數(shù)科學(xué)文獻(xiàn)中占主導(dǎo)地位 。
統(tǒng)計(jì)數(shù)字
在統(tǒng)計(jì)測試的大多數(shù)應(yīng)用中 , 模型中的一個(gè)假設(shè)是特定的影響具有特定的大小 , 并且已經(jīng)成為統(tǒng)計(jì)分析的目標(biāo) 。這種有針對性的假設(shè)稱為研究假設(shè)或檢驗(yàn)假設(shè) , 用來評(píng)價(jià)它的統(tǒng)計(jì)方法稱為統(tǒng)計(jì)假設(shè)檢驗(yàn) 。最常見的是 , 目標(biāo)效應(yīng)的大小是一個(gè)“空”值 , 表示零效應(yīng)(例如 , 研究處理對平均結(jié)果沒有影響) 。在這種情況下 , 檢驗(yàn)假設(shè)稱為零假設(shè) 。但是 , 也可以測試其他效果 。我們還可以檢驗(yàn)假設(shè)效應(yīng)是否屬于特定范圍;比如 , 我們可以檢驗(yàn)效應(yīng)不大于一定量的假設(shè) 。在這種情況下 , 假設(shè)被認(rèn)為是片面假設(shè) 。
很多統(tǒng)計(jì)學(xué)教學(xué)和實(shí)踐都形成了一種強(qiáng)烈的(也是不健康的)焦點(diǎn) , 即研究的主要目的應(yīng)該是檢驗(yàn)零假設(shè) 。其實(shí)大部分統(tǒng)計(jì)檢驗(yàn)的描述僅限于檢驗(yàn)零假設(shè) , 整個(gè)題目叫做“空假設(shè)顯著性檢驗(yàn)” 。零假設(shè)的這種排他性會(huì)導(dǎo)致對檢驗(yàn)的誤解 。更具誤導(dǎo)性的是 , 許多作者使用“零假設(shè)”來指代任何測試假設(shè) , 即使這種用法與其他作者不一致 , 并且在通用英語中被定義為“無效” 。
更精確的統(tǒng)計(jì)分析的目標(biāo)是提供對影響的確定性或不確定性的評(píng)估 。我們用假設(shè)的“可能性”來表達(dá)這種確定性 。但是 , 在傳統(tǒng)的統(tǒng)計(jì)方法中 , “概率”并不是指假設(shè) , 而是指在假設(shè)的統(tǒng)計(jì)模型下 , 數(shù)據(jù)模式的假設(shè)頻率的個(gè)數(shù) 。這些方法因此被稱為頻率論方法 , 其預(yù)測的假設(shè)頻率被稱為“頻率概率” , 而不是假設(shè)概率(誤解) 。
p值
假設(shè)頻率稱為P值 , 也稱為檢驗(yàn)假設(shè)的“觀察顯著性水平” 。p值和統(tǒng)計(jì)顯著性的傳統(tǒng)定義圍繞著零假設(shè) , 我們把所有其他用來計(jì)算p值的假設(shè)都視為完全正確 。由于我們不確定這些假設(shè) , 我們將學(xué)習(xí)更一般的P值視圖 , 這是對觀察數(shù)據(jù)和我們預(yù)測或期望看到的數(shù)據(jù)之間的兼容性的統(tǒng)計(jì)總結(jié) , 如果我們知道整個(gè)統(tǒng)計(jì)模型是正確的 。
測試統(tǒng)計(jì)(如T統(tǒng)計(jì)或卡方統(tǒng)計(jì))用于測量數(shù)據(jù)和模型預(yù)測之間的距離 。如果每個(gè)模型假設(shè)都是正確的 , 包括檢驗(yàn)假設(shè) , 那么P值就是所選檢驗(yàn)統(tǒng)計(jì)量至少與其觀察值一樣大的概率 。這一定義反映了傳統(tǒng)定義中丟失的一個(gè)關(guān)鍵點(diǎn):在邏輯上 , P值測試所有關(guān)于數(shù)據(jù)如何生成的假設(shè)(整個(gè)模型) , 而不僅僅是它應(yīng)該測試的目標(biāo)假設(shè)(如零假設(shè)) 。
通過獲得一個(gè)更小的p值 , 我們可以說 , 如果所有的假設(shè)都是正確的 , 那么數(shù)據(jù)將更加不尋常;但是一個(gè)非常小的p值并不能告訴我們關(guān)于假設(shè)有效性的任何事情 。我們舉個(gè)例子 。當(dāng)P值因?yàn)榧僭O(shè)的目標(biāo)而非常小時(shí) , 可能是因?yàn)檫`反了研究方案而很小 , 也可能是用不正確的數(shù)據(jù)分析的 。相反 , 較大的p值表明數(shù)據(jù)在統(tǒng)計(jì)模型下并不罕見 , 但它并沒有告訴我們關(guān)于模型的有效性和假設(shè)的任何事情 。由于違反了研究協(xié)議 , 它可能非常大 , 或者它可能使用不正確的數(shù)據(jù)進(jìn)行分析 , 或者只是為了表達(dá)的目的而提出有效的觀點(diǎn) 。
建立一個(gè)好的統(tǒng)計(jì)模型最好的方法是計(jì)算置信區(qū)間 , 現(xiàn)在很多期刊都需要這個(gè) 。
【統(tǒng)計(jì)中p值怎么計(jì)算 p值如何計(jì)算】這種對檢驗(yàn)中無效假設(shè)的關(guān)注 , 不僅會(huì)導(dǎo)致對檢驗(yàn)和估計(jì)值評(píng)價(jià)的誤解 , 還會(huì)掩蓋P值和置信區(qū)間之間的密切關(guān)系 , 以及它們共同的弱點(diǎn) 。

    推薦閱讀