注目の投稿

最も検出力が高いとされる多重比較|テューキー・ウェルシュ法をエクセルで算出する

検出力の高さは随一の多重比較「テューキー・ウェルシュ(Tukey-Welsch)法」


簡単な上に高い検出力を持つ方法として,「シェイファー法」を紹介しています.
有意差が出やすい多重比較|シェイファー法をエクセルで算出する


このシェイファー法と比べると算出に手間が増えますが,もっと甘い検出力を持っているのが「テューキー・ウェルシュ法」です.

今回は,エクセルでテューキー・ウェルシュ法を算出する手順を紹介します.



以下の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は,
このリンク先→「統計記事のエクセルのファイル」から,
「テューキー・ウェルシュ法」
のエクセルファイルをダウンロードしてご確認ください.





激甘多重比較|テューキー・ウェルシュ法の算出方法


例データは以下のようなものです.

「最も甘い多重比較が知りたい」

と思って検索している人が読んでいるのでしょうから,エクセル作業の基本的なところは割愛します.

データはA~D群までの5群.
それを以下のように,
「n数(COUNTA関数や手計算)」
「合計(SUM関数)」
「平均(AVERAGE関数)」
「分散(VAR関数)」
で算出しています.

このデータを元に,テューキー・ウェルシュのための統計量を算出していきます.


【手順1】誤差自由度


まずは誤差自由度を算出します.
B列15行目のところに,入力しました.


すべての群の「n数」を合計し,群の数を引き算する簡単なものです.
B列15行目には,以下の関数を用いた式を入れています.

=SUM(B10:F10)-COUNTA(B10:F10)


算出される値は「30」になります.


【手順2】誤差分散


次は誤差分散を算出します.
B列16行目のところに入力しました.


各群の「n数−1」の値と分散を掛け算し,それを全て合計して「誤差自由度」で割り算します.

わざわざセルを参照する必要はありませんが,念の為,どこの数字を扱っているのか分かりやすくするために,以下のような式にしました.


=((B10-1)*B13+(C10-1)*C13+(D10-1)*D13+(E10-1)*E13+(F10-1)*F13)/B15




【手順3】ステップダウンさせる統計量を算出する


さて,ここからがテューキー・ウェルシュ法における手間のかかる作業です.

テューキー・ウェルシュ法は,テューキー法やボンフェローニ修正などの,
「シングルステップ(一段階手順)法」
と呼ばれる方法ではなく,
「ステップダウン(下降手順)法」
と呼ばれるステップワイズの手順を用いる多重比較です.

実際のところ,ホルム法やシェイファー法などもそれに該当するのですが,テューキー・ウェルシュ法のステップダウンは,もう少し手間暇がかかります.

高い検出力を得るためには仕方ないことなので,頑張ってついてきてください.


理屈を解説しても難解だと思いますので,まずは先に計算をしてみましょう.


【ステップ1】全群中,全群の比較


今回の例データは5群なので,5群全てを一気に比較します.

以下のようにします.


本来なら1つの式で算出可能なのですが,画像と解説が分かりやすいように3つに分割しました.
(一連で書くと,とんでもなく長くなるので)


まず,B列19行目にこのような式を入れます.
セルに入力しているのは以下の式です.

=B11^2/B10+C11^2/C10+D11^2/D10+E11^2/E10+F11^2/F10


各群のn数と合計値を使って算出しています.
中身が知りたい人は,どこを参照しているのか見てください.



次に,C列19行目に2つ目の式を入れています.
セルに入力しているのは,以下の式です.

=(B11+C11+D11+E11+F11)^2/(B10+C10+D10+E10+F10)

これも,上述したものと同様に各群のn数と合計値を使っています.


最後に,これらを使って統計量を出します.
D列19行目に以下の式を入れます.
セルに入力しているのは,以下の式です.

=(B19-C19)/(COUNTA(B10:F10)-1)/B16


上述した2つの値を引き算し,「群の数−1」と「誤差分散」で割っています.
COUNTA関数を使っているのは,「群の数−1」が必要だからです.
素直に「5−1」や,「4」を入力してもOKです.


【ステップ2】全群 −1の比較


次は,全群から「−1」した状態での比較です.
例データは5群ですので,4群での比較になります.


「全群−1」というのは,

全群のなかから1つの群を抜いた場合の組み合わせ全てを算出する

という意味です.

今回は5群ですので,5通りの組み合わせが存在します.
それら全ての計算を行うわけです.

以下をご覧ください.
まずは,「A群・B群・C群・D群」の組み合わせ.
B列20行目のセルに入力しているのは,以下の式です.

=B11^2/B10+C11^2/C10+D11^2/D10+E11^2/E10


ご覧のように,まずは5群中でE群を抜いた4群の計算をしています.

続けて2つ目の式.
C列20行目のセルに入力しているのは,以下の式です.

=(B11+C11+D11+E11)^2/(B10+C10+D10+E10)


そのまま対応していることが分かりますよね.


最後に,これを使って統計量を出します.
D列20行目のセルに入力しているのは,以下の式です.

=(B20-C20)/(COUNTA(B10:E10)-1)/B16


群数が4群に減っていますので,今回は「4−1=3」となっています.
なので,COUNTA関数のところは「3」を入力してもOK.


そんな感じで,選択した群の数値を使って全部入力していきます.

例えば,BCDEであれば,以下のようになります.


全部入力すると,以下のような数値が得られます.





【ステップ3】全群 −2の比較


要領は理解できたかと思います.
そんな調子で,今度は「全群−2」の組み合わせです.


今回の例データは5群ですので,3群の組み合わせ.
つまり,10通りの組み合わせが存在します.

まずはA群・B群・C群をご覧ください.
1つ目の式はこちら.

=B11^2/B10+C11^2/C10+D11^2/D10



2つ目の式はこちら.

=(B11+C11+D11)^2/(B10+C10+D10)


統計量の算出はこのようになります.




途中のACEの組み合わせでは,こんなふうになります.



全部入力すると以下のようになります.




【ステップ4】2群間の比較


5群であれば,次が2対の比較になります.
これは群数によって異なりますので,扱うデータによって違ってきます.

5群であれば,10通りの組み合わせです.
組み合わせに応じて,これまでの要領で計算していきます.

もう計算方法は分かると思いますので,計算式は割愛して結果だけお示しします.



では,いよいよ検定に入ります.





【手順4】F分布の表とテューキー・ウェルシュ法の表を使ってステップダウン法による有意性を確認する


有意性の確認には,以下のF分布の上側5%点の表と,テューキー・ウェルシュ法のための上側100%αp点の表を使います.


F分布の上側5%点の表


テューキー・ウェルシュ法のための上側100%αp点の表

見えないと思いますので,画像をダウンロードするか,
統計記事のエクセルのファイル」から,
「テューキー・ウェルシュ法」
のエクセルファイルをダウンロードしてご確認ください.
※1つのファイル内に「F分布」「テューキー・ウェルシュの表」というシートに分けて掲載しています.


現時点で用意した表は,5%有意水準です.
なので,このブログ記事の限界としてテューキー・ウェルシュは「5%水準」での検定しかできませんので,予めご了承ください.



テューキー・ウェルシュ法の検定手順


検定手順は,「全群−1」と「全群−2」までの検定は「F分布の上側5%点の表」を使用します.

それ以降は,「テューキー・ウェルシュ法のための上側100%αp点の表」を使用します.


なお,3群での比較であれば,わざわざテューキー・ウェルシュを使わなくても,「シェイファー法」の方が検出力が高くなりますので,そっちを使ってください.

シェイファー法をエクセルで算出する



【検定ステップ1】全群−1の検定


今回の例データは5群ですので,

「5−1=4」となり,F分布の「4」の列を,
そして,誤差自由度は「30」ですので,

「2.690」

が得られます.


これがこのステップでの棄却限界値となります.

この値よりも,算出した統計量Fが大きければ有意となります.


例データをみると,
「14.619」
ですので,有意と結論づけて,次の段階にステップダウンします.


【検定ステップ2】全群−2の検定


「5−2=3」ですので,F分布表の「3」,
誤差自由度が「30」のところを見ると,

「2.922」

が得られます.
これが棄却限界値です.

例データを見ると,全ての組み合わせの統計量Fが「2.922」より大きいですので,これも全部有意です.


なので,次のステップへと行きます.


【検定ステップ3】テューキー・ウェルシュの表での検定


このブログでは示したテューキー・ウェルシュの表では,9群までの比較が可能です.


今回の例データは5群ですので,テューキー・ウェルシュの表にある,5群3個の列を見ます.

「5;3」

の列です.

その誤差自由度「30」のところを見ると,

「3.937」

が得られます.
これが棄却限界値です.

例データをみると,このステップでも全ての組み合わせが有意です.

なので,次のステップへ行きます.


【検定ステップ4】2群間の比較


例データのように,5群の場合は次が最後,つまりになります.

テューキー・ウェルシュの表にある,5群2個の列を見ます.

「5;2」

の列です.
その誤差自由度「30」のところを見ると,

「6.006」

が得られます.
これが棄却限界値です.

例データを見ると,
A群とB群,
B群とE群,
C群とE群が「6.006」より小さいことが分かります.

なので,これらの組み合わせが

「有意差なし」

となり,それ以外の組み合わせは,

「有意差あり」

となるのです.



最後に,検定結果全体を示します.

以下の赤くしたところが,5%水準で「有意差あり」となったところです.


ちなみに,最近の論文では「p=0.0XX」といった形でp値をそのまま掲載する場合がありますが,このF分布表やテューキー・ウェルシュ法の表を用いる計算方法では「p値」を出すことはできません.

あくまでも「 p < 0.05」の水準で論文やスライドには表記してください.


「p値を細かく出す」ことを気にする人がいますが,別にこの書き方は間違っていません.
統計解析ソフトが充実してきた現代ではp値を出すことが普通になりましたが,以前は表を使った手計算をしていたので,「p < 0.05」の書き方が一般的でした.

(っていうか,統計学者の人に聞くと,それが本来の正しい書き方とのこと.p値をわざわざ書く意味はありません)



ステップダウン法の注意点


これは「ホルム法」や「シェイファー法」にも同じことが言えるのですが,ステップダウン法での多重比較は,

2群間の比較に進むまでの段階で「有意差なし」が見つかれば,その時点でその組み合わせの比較は終了し,以降の比較手順はとらない

というルールがあります.


例えば仮に,以下のように「BCE」の組み合わせが棄却限界値を下回ったとしましょう.

すると,次の2群間の検定では「B群・C群・E群」での組み合わせ,つまり,
「BC」
「BE」
「CE」
は比較してはいけません.


上図の例は無理やり作成したものですが,この「BC」のように,2群間での統計量Fが棄却限界値上回ったとしても,上の階層での検定で「有意差なし」となっていれば,次のステップでも「有意差なし」として片付けなければいけません.

その点は留意しておいてください.






他の多重比較法と比べると・・・


テューキー・ウェルシュ法の検定結果を,その他の多重比較法と比較してみます.

比較する多重比較は,ボンフェローニ修正,ホルム法,シェイファー法です.

群数が増えると検出力が落ちやすいボンフェローニ修正,
比較的高い検出力を持つホルム法,
かなり高い検出力を持つシェイファー法です.

赤くしたところが,「有意差あり」のところです.



今回の例データであれば,ホルム法とシェイファー法は同じ結果になっています.

しかし,今回のテューキー・ウェルシュ法は,それら甘めの多重比較をさらに上回る検出力の高さを有していることが分かります.


実際,このテューキー・ウェルシュ法が単独の手法では最も高い検出力を出してくれます.


どうしても「有意差あり」と結論づけたい場合や,群数が多くて検出力が低下してしまう場合に使ってみてください.

手間ひまかけるだけの検出力を持っています.


上記の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は,
このリンク先→「統計記事のエクセルのファイル」から,
「テューキー・ウェルシュ法」
のエクセルファイルをダウンロードしてご確認ください.



・・・実は,もっと高い検出力を有する多重比較が!


このテューキー・ウェルシュ法ですが,実は,とある別の多重比較法と組み合わせて分析することで,さらに高い検出力を得ることができます.

その名も,
「ペリの方法」

近いうちに,この最強激甘多重比較法であるペリの方法をご紹介します.

※ということで,後日ペリの方法を書きました.

多重比較のなかで最も検出力の高い「ペリの方法」をエクセルでやる



関連記事
統計処理手法の選び方(1)
統計処理手法の選び方(2)多重比較の使い分け方法
統計処理手法の選び方(3)多重比較が不要な多重比較?
卒論・ゼミ論で統計学的有意差が出ない時に読むブログ記事
ExcelでTukey法による多重比較
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)