2017年3月16日木曜日

効果量(SE:effect size)をエクセルで算出する

すっかりご無沙汰している統計の記事です.
久しぶりですが今回は別にたいした話ではありません.
「効果量(SE:effect size)」“エフェクトサイズ”
についてです.

最近,実験結果などを「t検定」とか「分散分析」「多重比較」やなんかで統計処理するよりも,効果量で解釈しようというのを耳にすることが多くなってきました.
私のボスにあたる先生も,学生には効果量による分析を推奨するようになっています.

どうしてそんな話題が出てくるようになったのかというと,t検定とか分散分析などは「データが正規分布している」ことを仮定している統計手法なんですけど,でも実際の多くの研究実験では,そのデータが正規分布しているかどうかなんて確認できないからです.
詳細は■正規分布(wikipedia)を参照してください.

正規分布している(はずの)データだから,その比較しているグループの平均値に差があるかどうかを「p値(probability値)」で推計しようというのがt検定などです.
だとすると,サンプル数(測定したデータの数)が少なかったりすると正規分布しているかどうかが怪しいわけで,そこを査読者とか質問者につっこまれると大変だという話なんですね.

なので,これに対してどうすればいいかという話になって,だったら「p値」,つまり確率で話をしなければいいという作戦になります.
そこで出てくるのがサンプル数の影響を受けない「効果量」です.

もともと効果量の算出は統計学では一般的なものですが,「統計的に有意」かどうかで研究結果を解釈したい人が多かったので,あんまり利用されてきませんでした.
どちらかと言うとシステマティック・レビューとか,メタ分析などで目にする統計手法です.

日本では馴染みがないのか,日本版ウィキペディアにも載っていません.
ちなみに,英語版ウィキペディアには解説があります.
Effect size(wikipedia)

算出方法は簡単です.
比較したい両群の平均値を引き算し,それを標準偏差で割るというもの.

効果量 = ( A群平均値 − B群平均値 )÷ 標準偏差

具体例を出して説明していきます.
例えば以下のようなデータの場合.


このA選手〜E選手というのが超一流のアスリートで,せっかく苦労してデータをとったんだから,彼らならではのデータとして解釈したいということがありますよね.
でもこういうデータだと,先程のようにデータが「正規分布」しているかどか分かりません.
それにサンプル数も少ないもんだから,t検定をしてみたら・・・,


こんな感じで,あぁもう少しで統計的有意なのに・・,とガッカリすることもあります.
けど,平均値には「差がある」ように見えるし,なにより超一流アスリートにとってはこの練習前後の値は “ちょっとでも差があったら凄いこと” という場合は多いものです.
それをみすみす「練習前後で有意差はなかった」で済ますのも勿体無い.

では,効果量を算出するとどうなるか?
こういう計算をして,


こうなります.


ちなみに,後ほど解説しますが,「割り算するための標準偏差」をどこから取ってくるかが問題です.コントロール群の標準偏差を使うことが推奨されていますが,異論もあるようです.
ここでは,ひとまず練習前の標準偏差としましたが,実は効果量用の標準偏差がいろいろ考案されてますので,これは後ほど.

ではこの-0.5564という値はどのように解釈すればいいのか?
ウィキペディアから引っ張ってきますと,こうなります.
Effect size (wikipedia) より
効果量は絶対値で評価します.今回は-0.5564ですから,「0.5564」です.
その上で表を見ると,効果量は「Medium(中程度)」の大きさだと言えます.
つまり,「本研究で課した練習は,被験者に中程度の効果を及ぼした」と解釈することができるわけです.

先程の「標準偏差(s)」の話ですが,これには効果量用の標準偏差が示されています.
「比較したい2グループの標本平均の差の標準偏差」とされるものです.
その代表的なもの(Cohenが示した標準偏差)はこちらです.ウィキペディアからスクリーンショットすると,こういうものです.

例データで計算するとこうなります.
なお,B9とC9のセルにはN数(サンプル数)を入れています.5人のデータなので5です.


B13 のセルに入れているのはこういう計算式です.
=SQRT((B9-1)*B8+(C9-1)*C8/B9+C9-2)

そうやって算出した「s」を使って効果量を計算すれば,


このようになります.
-0.7682ですから,さっきの計算結果よりも大きな効果量になりました.
つまり,「本研究で課した練習は,被験者に大きな効果を及ぼした」と解釈することができるんです.

t検定にもノンパラメトリック検定にもフラれてしまったという人は,効果量の算出で2群間の差を評価してみてはいかがでしょうか.


関連記事
Excelで多重比較まとめ
ExcelでTukey法による多重比較
ノンパラメトリック検定で多重比較したいとき
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)

ちょっとした統計処理上のエクセル小技はこちら
エクセルで相関係数のp値を出す
エクセル散布図で相関関係・相関係数を確認する便利な方法
エクセルで大量のデータを等分割して統計処理したいとき
エクセルで大量のデータを処理したいとき
エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方法 part1
点数・得点を段階評価するためのエクセルシートの作成

その他,こういう怪しいブログ記事よりも,ちゃんと勉強になる書籍もご紹介しておきます.
詳しくは,
独学で統計処理作業をスキルアップさせるための本
を御覧ください.