注目の投稿

クラスカル・ウォリスの検定をエクセルでやる

「一元配置分散分析」のノンパラメトリック版|クラスカル・ウォリスの検定はエクセルで簡単にできる


ノンパラメトリック検定の多重比較をするということであれば,パラメトリック検定の多重比較の際に行う「分散分析」に相当するものを紹介しておかないといけないなということで,今回はクラスカル・ウォリスKruskal Wallisの検定を取り上げます.


Amazon広告




以下の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は,
このリンク先→「統計記事のエクセルのファイル」から,
「クラスカル・ウォリスの検定」
のエクセルファイルをダウンロードしてご確認ください.

以前,
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
という記事を書いていますが.
こちらではなく,どうしてもマン・ホイットニーのU検定での多重比較をエクセルでやりたい場合に利用してもらえると良いかと思います.


クラスカル・ウォリスKruskal Wallis(クラスカル・ワリスとも表記される)の検定.
対応のない3群以上のデータ間に有意性があるかどうか検定するものです.

パラメトリック検定である「一元配置分散分析」のノンパラメトリック版といったところです.

では,使用するデータの紹介です.
マン・ホイットニーのU検定(エクセルでp値を出す
でも紹介したように,群を立てに並べておくと,少しだけ作業が楽です.

上から順に,A群(赤セル),B群(青セル),C群(緑セル)です.
あと,A列のところにある数字は,各群のN数と「A14」に全N数を表示させています.
後ほど使用しますので.

次に,このデータの順位付け作業です.

RANK関数を使用し,昇順機能を使って....

一気に順位付けします.

※同順位値(タイ値)がある場合の処理については,
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
ウィルコクソンの符号付順位和検定(エクセルでp値を出す)
を参考にしてください.

で,
今度は,図のようにそれぞれの群の「順位の値」を平均させます.

そして,全部のデータの順位の平均値も算出します.

これで準備完了です.

これを基に,クラスカル・ウォリスの統計量を計算します.
かなり長いので,参照しているところを図で確認してもらって,参照箇所を間違えないように入力してください.


=12/(A14*(A14+1))*((A3*((D6-C14)^2))+(A8*((D10-C14)^2))+(A12*((D13-C14)^2)))



【注意】この式の最初の「12」っていうのは,どんなデータであっても「12」です.
どこかの参照値ではありません.

例では,統計量は「6.3949」になっています.

そして,p値を出すのですが,今回はエクセルのχ二乗検定の関数を利用します.
=CHIDIST(B16,2)


ということで,自由度を「2」にしてT(統計量)を参照します.
今回のデータ例であれば,0.0409という値が出ましたので,この3群間には有意性が認められました.


ちなみに,同データでのSPSSの算出結果は以下の通り.

このように,このデータについて群間に有意性が認められたということになりましたが,ではどことどこの群間に差があるのか?という点については,2群間のノンパラメトリック検定を行なわなければなりません.
今回のような対応のない2群間の検定としては,マン・ホイットニーのU検定などを使います.
マン・ホイットニーのU検定(エクセルでp値を出す

その後の多重比較には,
ノンパラメトリック検定で多重比較したいとき
Excelで多重比較まとめ
を参考にしてもらえるとOKです.

Steel-Dwass法を紹介していますので,あまり利用することは少ないかもしれませんが,何かの時に使ってください.


この記事の参考文献:
石村貞夫 著『すぐわかる統計処理』
池田央 著『統計ガイドブック』

手計算で算出するのが面倒な人は,思い切ってエクセル統計の購入をオススメします.
 




※その他,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書いています.参照してください.