2013年5月2日木曜日

標準偏差を用いた段階評価の仕組み

朝起きましたら,長期間ほったらかしにするのも良くないと思いましたので,昨日の続きを載せることにしました.
今回は,段階評価の仕組みを目で見てわかるように解説するものです.
段階評価の方法については,前回の記事,
点数・得点を段階評価するためのエクセルシートの作成 を御覧ください.

私自身,長らくこの「標準偏差を用いた5段階評価」を使っていたものの,どんな数値のいじりまわしで段階評価しているのか知らないままでして.
評価表を渡された選手も,
「細かいことはえぇんや!Aを目指せば “エー” んや!なんつって」
という文字通りの体育会系(+アホ)だったので,気にすることもなく.

このブログで「標準偏差を用いた段階評価」を使う気になった皆様におかれましては,ちゃんと仕組みを理解した上で利用できるよう確認しておきましょう.


例えば,こんなデータがあったとしましょう.綺麗すぎるデータですが,まぁ,分かりやすくするためなのでご了承ください.
データは20個あります.測定値は101〜120で「1」刻みという“珍しい”データとして見てください.
図の下の方にある,「Mean」というのは平均値,「SD」というのは標準偏差のことです.

で,このデータを使って段階評価をするのですが,その前に,データがどのように計算されているのか,視覚化したいと思います.
数学が得意な人には不要なんでしょうけど,いかんせん難しい人にとっては,「これ」こそ省かれるとチンプンカンプンになることですので.
 青い線が平均のところです.
その線を境として,上下に数値をふっています.
データは「1」刻みですので,ちょうど10個ずつのデータに分かれます.

さて,3段階評価用の基準値を算出します.前回の記事と同様です.
B列25行目のセルには,
=B22+1*B23
B列26行目のセルには,
=B22-1*B23
と入力しました.
その結果,こういう基準値が得られます.
 そしてこの数値に照らし合わせて,上のデータを3段階に分けてみましょう.

分ける条件としては,基準値「以上」であるかどうか?で振り分けます.
すると,以下の通りになります.
赤い線がその境です.

そんなわけで,3段階評価でA~Cに分けるという場合,このようになっているのです.
 ここで注目してほしいのは,標準偏差を用いた段階評価というのは,「等分」されているわけではないということ.
ご覧のように,「B」に該当するデータは11個,「A」と「C」の合計9個よりも多いのです.

さて,それを如実に見ることができるのが5段階評価です.
3段階評価と同様,以下のように
E列25行目には
=B22+1.5*B23
と入力していまして,以下,
=B22+0.5*B23
=B22-0.5*B23
=B22-1.5*B23
と計算して基準値を出します.

で,それを使って5段階にデータを分けてみました.
このように,かなりデータの分かれ具合が偏ります.

それをA〜Eのように評価しているわけです.
AとEは1個ずつ,BとCとDは6個ずつ,というものになりました.
ですので,「標準偏差を用いた段階評価」では,最高レベルと最低レベルの “対象” というのは,かなりレアな存在と評価できます.

もちろん,今回のように数値が綺麗すぎる場合は上記のようになりますが,よく扱うであろうデータではこのようにはなりません.
数値が1ずつ刻まれるというのは,通常,有り得ないので.

そうは言っても,たいてい普通のデータは「正規分布」するとされ,平均値と標準偏差は以下のような関係にあると説明されるのです.
※Wikipediaより引用
「μ」というのが平均.
「σ」が標準偏差であり,「1σ」というのが,いわゆる標準偏差の値.
「2σ」は標準偏差の2倍,「3σ」は3倍です.

平均値を基準に,1σ 〜 -1σの間には,68.27%のデータ(確率変数)があるとされ,2σ 〜 -2σの間には95.45%,3σ 〜 -3σの間には99.73%となります.

ここでやっと前回の最後の疑問の回答ですが,
この部分をいじるために,段階評価の基準値の式で「1.5」とか「-0.5」といった数値を「標準偏差」に掛け算しているのです.
んで,その掛け算済みの「元・標準偏差」の数値を,「平均値」に足したり引いたりして,「基準値」を出しているということ.

ですから,標準偏差を用いた段階評価には,この上の図や前述してきたような判別のクセがあるわけです.

そんなんじゃなくて,もっと「ランキング」っぽい評価がしたい,つまり等分して評価したい,という場合は,それはまた別の方法が必要です.
これはまた別の機会に.
※ということで,次の日にそれを紹介しました,
四分位とパーセンタイルでの段階評価をエクセルで作成

正規分布や標準偏差の細かい解説は他のサイトでたくさんされていますし,統計学の基本を扱った書籍で確認できますので,そちらに譲ります.


この記事の参考文献は以下のものです.