2012年2月22日水曜日

エクセルExcelでΧ二乗検定を

※エクセルで相関関係のp値を算出する手順は
エクセルで相関関係のp値を出す
を見てください.

私のこれまでの研究論文ではt検定や分散分析,相関分析など多く,過去の記事にもExcelだけでこれらの統計処理をなんとかする方法を紹介してきました.

エクセルExcelでの簡単統計(t検定)

私自身が 「Χ(カイ)二乗検定」 を使うことは少ないのですが,学生の卒論に多いアンケート調査の統計処理で利用しますので,私も自然と勉強させられました.

以前の記事にも書きましたが,人生において卒論でしか統計処理をすることがないであろう学生にSPSSの使い方を教えるのは面倒です.
なのでExcelだけでなんとかさせようという企てです.

「X(エックス)二乗検定のやり方を教えてください」 と元気に質問してくる学生にも温かく対応してあげている私ですので.
以下,えらく雑な説明だな,と感じる人もいるかと思いますが,Χ二乗検定のことを微塵も知らない人に向けた記事でもあるので,エキスパートの方はご容赦ください.

※後日,「そもそもアンケート調査のやり方自体で困っている」という人のために,
エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方 part1
を書きました.こちらもどうぞ.

Χ二乗検定というのは,「実測度数と期待度数との差を統計的に検定する」というものです.
Χ二乗を「エックスにじょう」と読む学生は,この時点で何を言っているのか分からないかと思いますので,具体的に話しをしていきましょう.

では,どんな場合にΧ二乗検定が利用されるのかというと,以下のようなデータの場合です.
何を統計処理にかけたいのかというと,
回答の比率に差があるかどうか?
つまり,
「はい」と回答した人は「いいえ」と回答した人よりも【 多いor少ない 】ということを統計学的に裏付けをとりたい
ということです.

35人(70%)の方が15人(30%)よりも多いに決まってんじゃん.バカなんですか?
と生意気にも言い出す学生もいますが,そこは優しく対処してあげてください.


こういうデータをExcelでΧ二乗検定したい場合は,上記のように入力しておきましょう.

回答パターンは2択ですね.
「はい」 か 「いいえ」 です.
2択なので,「はい」と「いいえ」のいずれかを回答する可能性は50%.
ということで期待値は「はい」「いいえ」ともに 「25」 と入力しておきます.

ExcelにはΧ二乗検定のp値を出す関数があります.

= CHITEST()

これを,以下のようにB7のところに入力しました.


=CHITEST(B3:C3,B5:C5)

【 B3:C3 】というところは実測値(観測値とも言う),
【 B5:C5 】というところは期待値を範囲参照しています.

これが意味不明な人はまた勉強しておいてください.
とりあえず,上記のようにすれば以下のように
Χ二乗検定のp値が出せます.

ご覧のとおり p値が0.05未満ですので,
「はい」と回答した人のほうが「いいえ」と回答した人よりも有意に多い,と言えます.

とりあえず今回は終わり.

次回は,もうちょっと複雑な分析をしてみましょう.

※そんなわけで,以下が次回の記事です.
エクセルExcelでχ二乗検定を part 2

※そのまた後に,3つ以上の比率の比較と調整済残差の話を解説した,
エクセルExcelでΧ二乗検定を part3
も書きました.

効果量を出したい場合はこちら
効果量(SE:effect size)をエクセルで算出する

信頼性係数を出したい場合はこちら
信頼性係数をエクセルで算出する

「そもそもアンケート調査のやり方自体で困っている」という人のためには,
エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方 part1

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.
その中でも,以下の2冊はχ二乗検定やアンケート調査方法を学ぶ上でオススメです.

 


以下も参考文献としてどうぞ.