2013年9月4日水曜日

基準となる相関係数との差を検定する


以前の記事では,
相関係数の差を検定したいとき
対応のある相関係数の差の検定
を紹介してきました.

今回は,基準となる相関係数との差を検定する方法をご紹介します.

つまり,左図のような検定です.
左図上のように,なにかしら基準となる相関係数があらかじめ調査されており,その相関係数と比較して左図下のような値と差があるかどうかを検定するというもの.

もう少し詳しく左図を使って説明すると,たとえば仮に,一般的な大学生における国語と英語のテスト成績の相関が「0.650」だったとしましょう(左図上).

そして今回調査した対象の大学生80名では,「0.490」だったとします.

「なんか今回調査した大学生はテスト成績の相関係数が,一般的な大学生よりも低いんじゃないかなぁ..」,と思ったので,これを検定したいというものです.

この検定方法は,基準値と比較して今回の測定値がどれほどか?というものですから,ちょうど,
あまり知られていないt検定
で紹介したようなt検定と考え方は一緒です.

この検定の便利なところとしては,基準値となる相関係数の詳細データがなくても,相関係数さえ分かっていればOKというところですかね.

ではさっそくエクセルでの計算方法を説明していきます.
以前の■相関係数の差を検定したいとき では,以下のようなものを紹介しましたが,
今回もこれと似たようなものになります.

先に上述した例を検定した結果を示します.こんな感じです.
N数80名での相関係数0.490は,基準となる相関係数0.650と比べて有意に低いことが分かりました.

前回と同じく,“水色のセルの部分” は,既に分かっている数値を手入力で構わないところです.

基準となるデータの相関係数(冒頭の例で言うと「一般大学生のテスト成績」)と,今回調査したデータのN数と相関係数(冒頭の例で言うと「今回調査した大学生のテスト成績」)を,それぞれ入力しておきます.

では,それ以外のところで計算しているセルを見ていきます.

このzの部分ですが,ここは前回の記事と変わっていません.
基準にしたいデータのzを算出するため,E列3行目のセルに,
=(1/2*LN((1+D3)/(1-D3)))
と入力します.

E列4行目は,今回調査したデータのzの算出です.
=(1/2*LN((1+D4)/(1-D4)))
を計算します.

そして,この両者と今回調査したデータのN数を使って「Z」を出します.
=ABS(SQRT(C4-3)*(E4-E3))

最後に,このZを使って5%で有意か否かを判断するp値を出します.
=2-(NORMSDIST(C6))*2

以上です.
こんな感じで使ってみてください.

ちなみに,検定に利用できるN数の条件ですが,「10以上」とのこと.

今回の統計処理方法の参考文献を以下に示しておきます.
御園生善尚 他 著『統計学大要』

そもそも,相関係数のp値をエクセルで求めたいという場合,
エクセルで相関係数のp値を出す

その他,こういう怪しいブログ記事よりも,ちゃんと勉強になる書籍もご紹介しておきます.
詳しくは,
独学で統計処理作業をスキルアップさせるための本
を御覧ください.