効果量（effect size）をエクセルで算出する

今回は，
「効果量（effect size）」“エフェクトサイズ”
についてです．

最近，実験結果などを「ｔ検定」とか「分散分析」「多重比較」やなんかで統計処理するよりも，効果量で解釈しようというのを耳にすることが多くなってきました．

私のボスにあたる先生も，学生には効果量による分析を推奨するようになっています．

どうしてそんな話題が出てくるようになったのかというと，
ｔ検定とか分散分析などは「データが正規分布している」ことを仮定している統計手法なんですけど，でも実際の多くの研究実験では，そのデータが正規分布しているかどうかなんて確認できないからです．

詳細は■正規分布（wikipedia）を参照してください．

正規分布している（はずの）データだから，その比較しているグループの平均値に差があるかどうかを「ｐ値（probability値）」で推計しようというのがｔ検定などです．

だとすると，サンプルサイズ（測定したデータの数）が少なかったりすると正規分布しているかどうかが怪しいわけで，そこを査読者とか質問者につっこまれると大変だという話なんですね．

なので，これに対してどうすればいいかという話になって，だったら「ｐ値」，つまり確率で話をしなければいいという作戦になります．

そこで出てくるのがサンプル数の影響を受けない「効果量」です．

以下の記事を読んでも不安がある場合や，元の作業ファイルで確認したい場合は，
このリンク先→「統計記事のエクセルのファイル」から，
「効果量をエクセルで算出する」
のエクセルファイルをダウンロードしてご確認ください．

もともと効果量の算出は統計学では一般的なものですが，「統計的に有意」かどうかで研究結果を解釈したい人が多かったので，あんまり利用されてきませんでした．
どちらかと言うとシステマティック・レビューとか，メタ分析などで目にする統計手法です．

日本では馴染みがないのか，日本版ウィキペディアにも載っていません（2017年現在）．
ちなみに，英語版ウィキペディアには解説があります．
■Effect size（wikipedia）

算出方法は簡単です．
比較したい両群の平均値を引き算し，それを標準偏差で割るというもの．

効果量＝（ A群平均値 − B群平均値）÷ 標準偏差

具体例を出して説明していきます．

例えば以下のようなデータの場合．

このA選手〜E選手というのが超一流のアスリートで，せっかく苦労してデータをとったんだから，彼らならではのデータとして解釈したいということがありますよね．
でもこういうデータだと，先程のようにデータが「正規分布」しているかどか分かりません．

それにサンプル数も少ないもんだから，対応のあるｔ検定をしてみたら・・・，

こんな感じで，ガッカリすることもあります．

けど，平均値には「差がある」ように見えるし，なにより超一流アスリートにとってはこの練習前後の値は “ちょっとでも差があったら凄いこと” という場合は多いものです．

それをみすみす「練習前後で有意差はなかった」で済ますのも勿体無い．

では，効果量を算出するとどうなるか？

こういう計算をして，

こうなります．

ちなみに，後ほど解説しますが，「割り算するための標準偏差」をどこから取ってくるかが問題です．
コントロール群の標準偏差を使うことが推奨されていますが，異論もあるようです．

ここでは，ひとまず練習前の標準偏差としましたが，実は効果量用の標準偏差がいろいろ考案されてますので，これは後ほど．

ではこの-0.7246という値はどのように解釈すればいいのか？
ウィキペディアから引っ張ってきますと，こうなります．

Effect size (wikipedia) より

効果量は絶対値で評価します．今回は-0.6218ですから，「0.6218」です．

その上で表を見ると，効果量は「Medium（中程度）」付近の大きさだと言えます．
つまり，「本研究で課した練習は，被験者に中程度の効果を及ぼした」と解釈することができるわけです．

先程の「標準偏差（s）」の話ですが，これには効果量用の標準偏差が示されています．
「比較したい２グループの標本平均の差の標準偏差」とされるものです．
その代表的なもの（Cohenが示した標準偏差）はこちらです．ウィキペディアからスクリーンショットすると，こういうものです．