統計処理している文献を読んでいると大体出てくるのがp値。
正直なところ…p値・95%信頼区間 etc...謎の単語が出てくるだけで文献を読むモチベーションが下がってしまっていた。
ただ…
このままではいかん!
と思い始めた今日この頃。
いつまでも向き合わずに逃げてしまってはいけないと思い、なんとか統計というものを少しでも理解しようと奮闘し始めた。
実際にp値はどのように使われているのか?
今読んでいる文献が
" ICUで重症患者に日記を渡すとPTSDの発症が減少する "
という趣旨である。
ちなみにPTSDとは?
PTSD(心的外傷後ストレス障害Post-Traumatic Stress Disorder)とは、実際にまたは危うく死ぬ、深刻な怪我を負う、性的暴力など、精神的衝撃を受けるトラウマ(心的外傷)体験に晒されたことで生じる、特徴的なストレス症状群のことをさします。
この論文の中で、
下から3行目にp=0.02とある。
この文章を翻訳してみる。
結果:352人の患者を一ヶ月で無作為化してみた。新規PTSDの発生は何もしていないグループに比べて、介入群(つまり日記を渡したグループ)で減少した(5% versus 13%, P=0.02)。
結論:ICUダイアリーを提供することは、精神的な回復を促進し、新規PTSDの発症を減少させるのに効果的である。
はい、p値がいます!
この文献を元に、p値とは何かを整理してみたいと思う。
p値とは何か?
先日に行ってきた勉強会によると
p値とは帰無仮説が成立する確率
とある。
…帰無仮説?
帰無仮説とは何か?
帰無仮説とは
「グループAとグループBに差がない」という仮説のこと。
なんで否定形なんだろう…
この研究で言えば、
「ICU日記を渡したグループと、渡していないグループで差がない」という仮説が帰無仮説ということになるか。
p値が0.05(=5%)を下回ると"差"がある。
即ち、帰無仮説は間違っている→グループ間で差はない
ということになる。
この論文だとp値が0.02と0.05以下であるため、グループ間で差があると結論付けているのである。
ちなみにp値が小さくなるのはグループ間で差がある場合だけではないらしい。
サンプル数が多いと小さくなってしまうとのこと。
この辺りの理由は、僕にはよくわからない。
「p値だけで判断してはいけない」と聞いていたのは、そのためなのか?
統計をガンガン扱っている人からすると浅い記事だろうけど、個人的には少しスッキリした。
以上です。
*1: 日本トラウマティック・ストレス学会HPより