2014年4月23日水曜日

エクセルで相関係数のp値を出す

最近はまったく統計学ネタを書かずにおりました.
というのも,ブログにするほどの統計ネタが見つからなかったからでもあります.

ですので,学生などから統計処理についてよく受ける質問を取り上げてみたいと思います.

「エクセルで相関係数を出したんだけど,それが有意かどうか? っていうかp値が知りたいんですけど」
というものです.
たしかにエクセルには相関係数のp値を算出したり棄却限界を示す機能はありません.

私も以前は,エクセルで相関係数を算出した場合,それが有意かどうかは「相関係数の棄却限界の表」みたいなのを利用していました.
もしくはSPSSを使うとか.
でも,そんなに苦労せずに相関係数の棄却域を算出できますので,ご参考までに.

では早速,例を示しながら見ていきましょう.
以下の様なデータがあったとします.
ボールを投げる力「遠投力」と,腕っ節の力「握力」に相関がみられるかどうかを調査したものです.

散布図を見ても,どうやら関連性がありそうですね.
では,このデータから相関係数を算出してみます.

以下のように,
=PEARSON(A2:A13,B2:B13)

というものを入力して「r」値を算出しました.
D列2行目に「0.597875」と出ています.

ではここからが本題です.
次に,以下のようにしてt値を出すのです.
=D2*SQRT(12-2)/SQRT(1-D2^2)

今回の例のセルには,上記のように入力しています.
何を入力しているのかというと,

=相関係数 × SQRT(N数 − 2) ÷ SQRT(1 − 相関係数の二乗)

というものです.

そして最後にこの「t」値を使って,
=TDIST(D4,10,2)

というように入力したら「p」値が出てきます.

これも少し解説しておくと,以下のようにな関数入力になっています.
=TDIST(t値,10,2)
「10」というところは,自由度のことでして.今回は相関係数のp値算出ですので,
N数 − 2
である「10」を用います.

一番最後の「2」は尾部です.両側での検定にしたいので「2」を入力しています.

なお,負の相関などでt値がマイナス値になる場合,それを絶対値にしてから算出してください.
つまり,上述した式を以下のように,
=TDIST(ABS(D4),10,2)
で算出します.

すると,
めでたくエクセルで相関係数のp値が出てきました.

これも一度作り方がわかってしまえば,オートフィルなんかで一気に作業をすることもできますね.

後日,
エクセル散布図で相関係数・相関係数を確認する便利な方法
を紹介しましたので,そちらもどうぞ.

信頼性係数も紹介しました.
信頼性係数をエクセルで算出する

関連記事


その他,こういう怪しいブログ記事よりも,ちゃんと勉強になる書籍もご紹介しておきます.
詳しくは,
独学で統計処理作業をスキルアップさせるための本
を御覧ください.