2012年3月27日火曜日

ExcelでTukey法による多重比較

統計処理ソフトを買えばいいものを,どうしてもExcelで多重比較をしたい人に向けた記事として過去に何本か紹介しました.
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)
ノンパラメトリック検定で多重比較したいとき
Excelで多重比較まとめ

今回は,多重比較の中でも非常に便利な方法とされているテューキー法(Tukey法)を紹介します.

Tukey法は,これまで紹介した多重比較法と違い,統計処理ソフトを用いずにp値を算出することは難しいようです.
5%水準(または1%水準)で有意かどうかを判断する方法だけを紹介します.

例として使うデータですが,以下のようなものです.
A群~D群の4群で,各群のデータの繰り返し数は5です.
ちなみに,この各群のN数(繰り返し数)は一致していないと,今回紹介するTukey法は使えませんので注意してください.

※その後,繰り返し数(N数)が違っても計算できるTukey-Kramer法を記事にしました.
繰り返し数(N数)が異なる群を,Excelを使ってTukey法で多重比較する
こちらも合わせてご覧ください.


「平均」というところは各群の平均値を算出しています.

そして,「分散」というところですが,以下のような関数「VAR」を使って算出しています.
VARという関数で普通に出せます.

そして,G列9番目の数値「227.8」ですが,以下のように,
各群の「分散(VAR)」を平均したものです.

これでTukey法を行う準備は完了.

参考までに,このデータでボンフェローニ法(Bonferroni法)による多重比較の結果も示しておきました.
ボンフェローニ法では,C群とD群の間にのみ有意性が認められています.
前回の記事でも書きましたが,ボンフェローニ法は4群以上の多重比較になると有意性の検出が著しく低下します.
つまり,「~の方が~よりも有意に高い」と言いたいのに,そんなふうにならない場合が多くなってしまうのです(別にいいんだろうけど).
要は,悔しい思いをするということです.

ですから,この “検出力” が高い(それでいて安全な)手法を探しまわることになるのですが,Tukey法はそのバランスが優れているというわけです.


では,そんなTukey法をさっそくやってみましょう.
ボンフェローニの時のように,比較したい群ごとに以下のように入力していきます.
画像にもあるように,A群とB群であれば,

=ABS(C8-D8)/SQRT(G9/5)

なんでこんな関数を入れていくのか,それが分からなくても,とりあえず入力してください.
とにかく上記のようにして入力するのです.

ザックリと解説すると,
A群とB群の平均値の差を出しているのが前半部分.差を出すことに専念したいので,四の五の言わずに「ABS関数」を使って絶対値にしています.
後半部分は,「各群の分散の平均」である「227.8」を繰り返し数の「5」で除し,その平方根をとっています.
そんなふうにして,6通りの組み合わせ全部を計算してください.

「全部計算できたんだけど,この数値にどんな意味があるの?」ということになりますが,実はこれでTukey法の計算は終了です.

おめでとうございます.

あとは,「キュー◯ー3分間クッキング」のごとく,あらかじめ用意しておいた,
【スチューデント化された範囲の表】
に照らし合わせて有意かどうかを判断するだけです.

画像ですので使いにくいかと思いますが,以下に【スチューデント化された範囲の表】を出しておきます.
画像部分をクリックすれば大きくなります(落として印刷して使ってください).

まずこれは5%水準の表.


そしてこれは1%水準の表です.
「スチューデント化された範囲」などのキーワードでググれば,いろいろと出てきますので,そっちを参考にしてもいいでしょう.
Excelに落とせるやつも見つかるかもしれません.

※後日,この「スチューデント化された範囲」の表に載っていない値を算出する方法を記事にしました.
スチューデント化された範囲の表の補間
本格的にTukey法で統計処理作業をするつもりでいるのなら大事なことなので,参考にしてください.


ここでは5%水準の方を見ていきます.

このデータは4群で繰り返し数が5ですから,

群の数:4
ν:5

の部分を見ます.
「5.22」ですね.

ということで,この「5.22」よりも数値が大きくなっている組み合わせのところが有意であると判断します.
実際に例のデータを見てみますと,
となっておりまして,A群とC群,C群とD群のところが「5.22」よりも大きいので有意ということです.


Tukey法の算出方法はもう一つあります.お好みに合わせて使います.

まずは以下のように各群の平均値を組み合わせ毎に引き算して差を算出します.
ABS関数を使って絶対値にしておいてください.
こうして算出した「平均値の差」が有意かどうか調べるんですが,その判断材料を以下のようにして算出します.

4群×繰り返し数5の値である「5.22」を使い,

=F11*SQRT(G9/5)

という計算をします.
すると,このように
「35.24」という値が出ました.

先ほど算出した各群の組み合わせによる「平均値の差」の値が,この「35.24」よりも大きいところに有意性が認められるのです.

先に紹介した算出方法とは計算の手順が違うだけで,同じものが得られます.


最初に示したボンフェローニ法の多重比較結果と比べてみても,Tukey法の方が検出力が高いことがわかります.


次回は,SPSSを使わずExcelでノンパラメトリック検定を行う方法を取り上げます.
ノンパラメトリック検定で多重比較したいとき,と合わせて見てもらえれば全てイケるようにしてみたいと思います.


※その後,繰り返し数(N数)が違っても計算できるTukey-Kramer法を記事にしました.
繰り返し数(N数)が異なる群を,Excelを使ってTukey法で多重比較する
こちらも合わせてご覧ください.

※統計的有意にこだわらない検定もあります.
効果量(SE:effect size)をエクセルで算出する

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.
とりあえず,手計算で多重比較をしたい方は,以下の2冊がオススメです.