2012年10月20日土曜日

ウィルコクソンの符号付順位和検定(エクセルでp値を出す)

前回はマン・ホイットニーのU検定でしたので,今度は対応のある2群間の検定ということで,ウィルコクソン(Wilcoxon)の符号付き順位和検定をやります.

ウィルコクソンの符号付き順位和検定ですが,私にとっては思い入れのある検定方法でして.
卒業論文の統計処理に採用した,私の論文初の検定方法です.

パラメトリック検定では有意性が認められないから 「どーしよー・・・」 と悩んでおり,指導教員の言われるがままにノンパラメトリック検定に鞍替えすることに.
マッキントッシュのスタットビュー(Stat view)を「あーでもない,こーでもない」とメチャクチャに操作して,肩がコリながらやった覚えがあります.

t検定などは平均値の差を検定するものですが,このウィルコクソンの符号付き順位和検定は「中央値」に差があるかを検定するもの,ということを聞きました.
当時は「何言ってんのか意味不明・・・」だったのですが,こうして手計算(エクセルだけど)したら意味もわかるというものです.

では早速,
使うデータは以下のようなものです.
対応のあるt検定も同様ですが,並べる順番に気をつけてください.
対応のある検定データの検定ですから,各行で隣合うデータは「対応がある」状態にしておきます.

まず,このデータの差を算出します.
大したことではありません.引き算をするだけです.
次に,それぞれの「差」を絶対値にします.
「ABS」関数を使えば一気にできます.
この絶対値にした数列のところで,マン・ホイットニーのU検定の時のように,順位をつけます.
「RANK」関数を使うとよいでしょう.昇順にして順位付けです.
ノンパラメトリック検定で注意しないといけないのは,同順位値が出た時ですね.
この場合,「4」が2ヶ所でみられます.
よって,4位と5位にあたる部分ですから,この2ヶ所の「4」を「4.5」にしておきます.
(こればっかりは手作業)
ウィルコクソンの “符号付き” 順位和検定ですから,「符号付け」作業をします.
上記のように,IF関数を使うのが便利です.

 次は,その順位を2乗させます.

【順位】か【符号付】の列の数値に「^2」とすれば,一気に計算できます.

そして,【符号付】と【^2】の列を合計します.
それぞれ,以下のような感じに.
上図は符号付の列,
下図は^2の列.
 さて,
この例題では【符号付】の列の合計がマイナスになっているので,本来不要なのですが,この数値はマイナスにしとかなきゃいけないので,「マイナスにする」作業を入れときます.
 あとで元データ(Xi,Yiの部分)をいじったとしても安心なように,これも「IF」関数を使って自動化しておきます.
さて,いよいよ統計量「Z」を算出です.

=(G14)/SQRT(H13)

このように,「マイナスにする」の数値と,「^2」の合計値をそれぞれ使用します.

最後に,の「Z」を使ってp値を算出です.
 マン・ホイットニーのU検定でも使った,「NORMSDIST」関数を使います.
この関数の(z)のところに,さっき出した「Z」の値を参照します.

=NORMSDIST(E16)*2

例のごとく,値を2倍しときます.
 というわけで,この対応のある2群のデータには有意な差が認められました.

SPSSの計算結果も,
 というように,同じになりました.

ウィルコクソンの符号付順位和検定で気をつけなければならない点をもう一つ.
以下の例でいうところの,D列12行目のように差がない(つまり差が0になる)データは順位付け作業に採用してはいけません.

ちなみに,以下の例では,【符号付】の合計値がプラスになっていますが,それをマイナスにしていることも確認しといてください.

これで対応のある2群のノンパラメトリック検定もエクセルでできるようになました.

多重比較検定をしたい場合は,
まずデータ間に有意性があるかどうかをフリードマンの検定で確認して,
フリードマンの検定をエクセルでなんとかする
その後,
Excelで多重比較まとめ
ノンパラメトリック検定で多重比較したいとき
を参照して検定してください.


※こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書いています.参照してください.
    

2012年10月18日木曜日

マン・ホイットニーのU検定(エクセルでp値を出す)

以前,3群以上のデータ間の差をノンパラメトリック検定し,それを多重比較する方法を紹介しました.
ノンパラメトリック検定で多重比較したいとき

その記事で私は,面倒くさがりなのでマン・ホイットニー(Mann-Whitney)のU検定による多重比較をSPSSのデータを元に紹介しています.
ですが,SPSSを持っていないとかエクセル統計もインストールしていないという人.あと,単純にエクセルでマン・ホイットニーのU検定のp値を出したいというマニアックな人がいるかと思いましたので,ここにそれを紹介しようと思います.


※後日,マン・ホイットニーのU検定で多重比較するためにも
クラスカル・ウォリスの検定をエクセルでやる
を記事にしました.


これで,「スチューデント化された範囲の表」とかを使わずとも,エクセルだけの機能を使ってノンパラメトリック検定の多重比較ができるようになります.
ぜんぜん嬉しくないことですが,これが人間のやることです.

マン・ホイットニーのU検定.
ウィルコクソンの順位和検定とも呼ばれる方法と同様のものです.

使うデータは以下のようなものです.
N数はA群:6,B群:5となっています.
そしてこれから「ノンパラメトリック検定」ですから,順位付けをしなければならないので,いつもと違い,群を縦に並べています.

では,順位付けです.
=RANK(B2,$B$2:$B$12,1)
という関数を使い,オートフィルでランク付けです.
上記のようになりました.
ちなみに,同順位値(タイ値)がある場合はどうすればいいかというと,以前,
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
で紹介したように処理してください.

そして,この順位値を群ごとに合計します.
ではいよいよ,マン・ホイットニーのU検定らしい作業に入っていきます.
統計量「U」を算出するため,以下のような式をセルに入れます.
=(A5*A11)+(A11*(A11+1)/2)-D12
A群,B群のどちらのN数や合計値を使ってもいいというわけではなく,N数が小さい方を1,大きい方を2とすると,

= (n数1 × n数2) + (n数1 × (n数1 + 1) / 2) -合計値1

ということにしておきましょう.


次は,p値を出すための算出です.
「平均」を出します.
=(A5*A11)/2

次に「分散」を出します.
=((A5*A11)*(A5+A11+1))/12

そんな感じで,最後に「Z」を出します.
 =(B14-B15)/SQRT(B16)

ということで,この算出した「Z」を使ってp値が出せるようになります.

以下の「NORMSDIST」という関数で出せるみたいです.
=NORMSDIST(B17)*2

数値を見てみると,
ということで,このデータは群間に有意な差が認められました.
ちなみに,SPSS11.0で算出した検定結果と比べてみましょう.
ん?ちょっと違う?
ということで,エクセルに貼り付けたデータにしてみました.
よかったです.同じ結果になっています.

たまにあるんですよね,SPSSの表示が算出値と少し違うこと.
焦ります.

でも「正確有意確率」の結果の方が優先されるということを聞きます.
であれば,0.052ですので,有意性はないことになっちゃいます.

今回紹介したのはSPSSの表示にある,「Z」を元に「漸近有意確率」というところを算出していることになります.
「正確有意確率」の算出ではありません.
正確有意確率の方を算出したほうがいいようなんですけど,まぁ,大外れするわけじゃないんだし,とりあえず正規分布に近似させた場合の確率なんで,という言い訳でいきましょう.

また追加情報があれば記事にします.

※統計的有意にこだわらないのであれば,
効果量(SE:effect size)をエクセルで算出する
がオススメです.

※こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書いています.参照してください.
   

2012年10月16日火曜日

そう言えば、ファンタジスタの会

そういえば,少し前にファンタジスタの会を執り行いましたのでご報告しておきます.

日教組と闘う例の高校体育教師と,母校に舞い戻ってきたバカボンのパパに似た素敵な女性を招いての,楽しい夜でした.

私としては,久しぶりに同じ研究室(学部時代の栄養学)の後輩に会えたのが “まともな” 収穫で,ファンタジスタの2人とは案の定,会話が無駄にはずんで疲れました.

お二人と話をしていると,私も頑張らないといけないな,と励まされる想いがします.

当日,東京からやってきた高校教師は,その日に東京に帰って行きました.

がんばりますね.

本当に,ただ,関西に来て話したかったんだそうです.


それだけじゃ普通のブログなので,オススメの書籍を一つ紹介します.

多木浩二 著『スポーツを考える-身体・資本・ナショナリズム-』

硬派にスポーツを考えるための本.
スポーツを専門にする人は一読の価値ありです.
(一読では理解できないかも)

古本屋に結構出回っているようで(私がよく行く何店かのお店では),あまり労せず手に入れられます.

著者はスポーツの専門家ではないそうですが,それだけに客観的にスポーツという活動の本質をえぐり出してくれています.

2012年10月12日金曜日

iPhoneはじめました

誕生日プレゼントとして,SIMフリーのiPhoneをいただきました(ちなみに私のキャリアはdocomoです).
ごきげんな状態.

タッチディスプレイの感度,キビキビした動作はさすがです.

さっきまで使っていたスマートフォンよりも,慣れていないはずのiPhoneの方が使い勝手が良い.
ムカつくけど,これは仕方がない.

心配していた電話通話も確認できました.

docomoのスマートフォン・ユーザーの感想としましては,今のところ圧倒的にiPhoneが便利です.
精神衛生上も,こればかりは認めざるをえないですね.

ちなみに,さっきまで使っていたSIMカードを抜いたスマートフォンですが,Wi-Fi環境であれば普通に通信端末として利用可能なようで(通話はできないけど),しばらくは捨てずに置いとこうと思います(Wi-Fiが入ってる職場とかでは,なにげに便利).
そのうちiPhoneに不具合が出るかもしれないし.

とりあえずiPhone生活を楽しんでいきます.