注目の投稿

有意差が出やすい多重比較|シェイファー法をエクセルで算出する

有意差が出やすい多重比較「シェイファー(Shaffer)の方法」


科学分析をする上での倫理は分かっている.

でも,どうしてもここに「有意差あり」と書きたいんだ.

という状況があることも理解できます.


テューキーHSD法でやっても,ホルム法でやっても,ノンパラでやっても有意差が出てこない.
今からでも被験者数を追加する,もしくは分析項目を変えてみるか?
いや,そんなことをしている時間はない.

「もうダメだ.おしまいだぁ・・・」


と頭を抱えている研究者に捧げる記事です.





シェイファーの方法|簡単に甘い検出力を出せるけど,多くの論文に書ける多重比較法として認められている


この方法は,よく知られている多重比較法である,
テューキーHSD
テューキー・クレーマー
ダネット
ボンフェローニ
といった方法と比べれば知名度が低いものですが,少しでも多くの有意差が出てほしい研究をしている場合には強い味方となります.


SPSSなどの統計処理アプリには装備されていないことが多いので,エクセルで手作業してください.


なんにせよ,手元にある統計処理結果の,

「 p = 0.057 」

といった際どいp値に絶望している人にとっては,福音となるでしょう.


以下の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は,
このリンク先→「統計記事のエクセルのファイル」から,
「シェイファー法」
のエクセルファイルをダウンロードしてご確認ください.




エクセルでのシェイファーの方法の作業手順


例データは以下のようなものです.

A群〜D群(5群)の対応のないデータを例にしていますが,対応のあるデータでも構いません.


話を早くするために,これらを使って一元配置分散分析とt検定での10対の対比較を済ましているとします.
対比較は,対応ある/なしのt検定以外でも,2群のノンパラメトリック検定でもOKです.

そもそもt検定や2群のノンパラからよく分からないという人は,
知識ゼロから始めるt検定の使い方・選び方|間違いやすいポイントを確認しておこう
ウィルコクソンの符号付順位和検定(エクセルでp値を出す)
マン・ホイットニーのU検定(エクセルでp値を出す)

といった記事を読んで,以下のような「p値」を算出しておいてください.


5群による対比較なので,10通りの組み合わせになります.
セルに入力すると以下のようになります.
※t検定は対応のないt検定(検定の種類「2」)を使っています.

このままのt検定の「p値」を使うと統計処理における多重性の問題に引っかかるので,
「多重比較」
をしないといけないわけです.


今回は,今までに紹介してきたなかでも,かなり甘めに出るけどエクセルでの算出が困難な「テューキー法」をさらに上回る甘さを持っており,
しかも,簡単に算出できる「ホルム法」より甘めで,それでいてさほど手間が変わらない「シェイファー法」をやります.


この方法は,ホルム法と同様に,

「p値の大きさ順にα値(p値)を補正する」

という方法を用います.


※ホルム法をおさらいしておきたい人は,
Excelで多重比較まとめ|ボンフェローニ(Bonferroni)|サイダック(Sidak)|ホルム(holm)|ライアン(Ryan)

を確認しておいてください.





【手順1】p値の大きさを順序づける


では,t検定のp値を補正していきます.

まず,p値の大きさの順序を明らかにしておきましょう.
少ない群数のデータであったり,パッと見て順序が分かる人は不要なのですが,ここでは分かりやすくするため「RANK関数」で順序をつけました.
昇順にしています.
「1」が,一番p値が小さく,「10」が一番大きい数値です.


繰り返しますが,この作業はエクセル上で行う必要はありません.
頭のなかで分かっていればOKです.


【手順2】比較する意味のある組み合わせに応じて補正する


ここからホルム法の考え方との大きな違いです.

ですが,まず最初の比較(1番目)は,同じく5群でのホルム法やボンフェローニ修正と同様に,

10通りの組み合わせなので,「10」

を補正値にします.


=B15*10


例では,A群とD群のp値が一番大きいので,ここに「10」を掛け算しました.



2番目の比較から多重比較の考え方に,大きく違いが現れます.

ボンフェローニ修正は全ての組み合わせに「10」を補正し,ホルム法では次は「9」になります.

しかし,シェイファー法では「6」になるのです.
※補正値が小さいので,それだけ有意差が現れやすくなることを意味します.


大事なことなので,その理屈を説明しておきます.

が,面倒だと思う人は次のステップに読み進んでください.


ボンフェローニ修正やホルム法では,補正値を機械的に決定しています.
一方,シェイファー法では多重比較する意味のあるものだけに限定します.


5組の対比較の場合は10通りの組み合わせが存在します.
ですが,今回のように最初の組み合わせの群間(A-D)のt検定に有意差が認められたのであれば,次の多重比較にはA群とD群を比較する必要はありません.

つまり,一番大きなp値を有していたA群とD群のいずれかは,他の群とは明らかに異なる群ということになります.

統計学における理論上の話をすれば,全ての群に有意差はないという帰無仮説が展開されています.
すなわち,

統計上の仮説: 群1=群2=群3=群4=群5

であるのですが,最初の処理により,

統計上の仮説: 群1=群2=群3=群4 ≠ 群5

ということになったわけです.

なので,次のステップでは,理論上はA群またはD群を除いた4群による組み合わせ,すなわち,
「6通り」の場合の補正値である「6」が採用されるべき
という理屈なのです.


6群データの場合,次は「10」.
3群データの場合は,以降は補正しなくていい(つまり「1」)と考えます.


しかしこれは,3群〜4群の場合は比較的簡単に処理できますが,群の数が増えると各段階ごとで除外できる群の確認作業が冗長になります.



そこで,以下のような表が用意されていますので,これを使って入力してください.

【手順3】シェイファー法のための表を見て処理する


以下の表を使って,最初の群(今回の例であれば,「5群」)のところを確認して,段階に応じた数値を入力します.


5群データの場合は,
最初は「10」
2番目から5番目までは「6」
6番目と7番目は「4」
8番目は「3」
9番目は「2」
10番目は「1」
です.


なお,ここで紹介しているファイル自体が欲しい人は,
このリンク先→「統計記事のエクセルのファイル」から,
「シェイファー法」
のエクセルファイルをダウンロードしてご確認ください.
上記の表も,元データであるエクセルファイルで入手可能です.


よくある多重比較として,5群までの表を見やすくクローズアップしたものがこちらです.
参考にしてください.



例データを,2番目以降これに基づいて入力したものが以下です.

表の数字に従って,このように入力していきます.



そうやっていくと,最終的にこんなふうになります.


0.05未満の有意差が現れているところを,赤くしました.


他の修正方法と比べ,シェイファー法がどれだけ甘いか比べてみました.
ボンフェローニとホルムによる多重比較の結果と並べたのがこちらです.


シェイファーの性質上,5群による多重比較であれば,特に「2番目〜6番目」のところにホルム法よりも大きなアドバンテージがあります.


今回の例データであれば,ホルム法はボンフェローニ修正との違いが出ていません.

よく見ると,「C群とD群」「D群とE群」のところは,ホルム法は「あとちょっとで有意になるのに」という状態です.


上記の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は,
このリンク先→「統計記事のエクセルのファイル」から,
「シェイファー法」
のエクセルファイルをダウンロードしてご確認ください.



シェイファー法は簡単に算出できて便利な上に,検出力が非常に高い方法です.

「エクセルしか持っていないからテューキー法が出来ない」
と悩んでいる人は,テューキー法よりも甘く検出される場合も多いので,こちらを使ってください.


しかし,上には上がいます.
もっと甘々な多重比較があるんです.

これも作業がやや冗長になってしまいますが,
「テューキー・ウェルシュ法」(いわゆるテューキー法と呼ばれる多重比較ではないよ)
という多重比較法があるので,こちらも近々ご紹介します.

※ということで,そのテューキー・ウェルシュ法を記事にしました.
最も検出力が高いとされる多重比較|テューキー・ウェルシュ法をエクセルで算出する


関連記事
統計処理手法の選び方(1)
統計処理手法の選び方(2)多重比較の使い分け方法
統計処理手法の選び方(3)多重比較が不要な多重比較?
卒論・ゼミ論で統計学的有意差が出ない時に読むブログ記事
ExcelでTukey法による多重比較
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)