2012年6月30日土曜日

エヴァンゲリオンは竹取物語である

「エヴァンゲリオンは壮大な近未来 “竹取物語” である.
日本最古のSFを,日本最新のSFとして焼き直したものである」

エヴァ好きの学生がいまして,「結局,あのストーリーで伝えたかったことは何なんでしょうか?」と聞いてきたので,このように答えました.

他に意見を同じくする人はいないものかとググったら,やっぱりおりました.以下のサイトでも紹介されています.同志一名,少し安心しました.
http://homepage3.nifty.com/mana/sinwa.htm

あれって1995年の作品ですよね.90年以降に生まれた学生はリアルタイムで見ているわけじゃないですよね(私もリアルタイムじゃないけど).

最近になって新劇場版(2007年〜)が制作されていますが,旧作のほうから興味持って見ている大学生もいるようです.


さて,エヴァンゲリオンのどこらへんが竹取物語なのか?というところを説明しましょう.

まず「竹取物語」のストーリーをささっと紹介しておきます.竹取物語は,
**********
正式には「竹取の翁の物語」という.
月の都で罪を犯した「かぐや姫」.罰として下界への流刑処分となり,刑に服するため竹の中で嬰児となっていた.

それを見つけた “竹取りのお爺さん”.女の子を「かぐや姫」と名付けてお婆さんと一緒に大切に育てる.

「かぐや姫」は普通の人間よりも早く成長するようで,たった3ヶ月で成人.

都で噂されるほどの美人であるかぐや姫は,連日多くのプレイボーイから求婚される.

彼らを鬱陶しく思ったかぐや姫.結婚条件として無理難題をふっかけ,彼らを次々と不幸と死に追いやる.

ついには時の帝もかぐや姫ゲットに乗り出し天皇パワーで追い詰めるが,「実は私,ヒトじゃないのです」とかぐや姫.“発光体”に姿を変えてみせ,帝の度肝を抜く.

いつの日からか,かぐや姫は涙を流すようになる.四六時中泣き続けるかぐや姫.聞けば服役期間が終了するため,月に帰らなければならないとのこと.

「そうはいくか!」とお爺さん.帝の協力を得ることもでき,弓兵の大量投入により自宅を対空防御要塞とする.

ついに夜空からやってきた飛ぶ車を伴う天人たち.用意した弓兵は精神攻撃と脱力感に苛まれて動けない.やっとの思いで射た矢も天人や飛ぶ車には当たらない.

お爺さんと天人の押し問答.かぐや姫からも諭され,嫌々ながらも見送るお爺さん.せめてもと,かぐや姫は形見として帝とお爺さんに手紙と「不死の薬」を置いていく.
「天の羽衣」を着せられたかぐや姫は,下界での記憶をなくし,「天人」として月に帰る.

嘆き悲しむお爺さん.今更「不死」を望む気持ちになれない.
かぐや姫からの手紙に感動した帝.部下に駿河国にあるという日本一高い山で不死の薬と手紙を燃やすよう命じる.
大勢の兵士を使ったプロジェクトであったため,以来,人はその山を「富士の山」と呼んだ.
今でも富士の山からは煙が立ち昇っている.
**********
これが竹取物語のあらすじです.

では,エヴァンゲリオンのストーリーと竹取物語の類似性を説明していきます.
かなり直接的に類似性の高い設定として,「かぐや姫=綾波レイ(リリス)」が挙げられます.
ざっと挙げると,

■竹の中から産まれた女の子「かぐや姫」 ≒ 試験管の中で産まれた女の子「綾波レイ」

■普通の人より早く成長するかぐや姫と綾波レイ

■「かぐや姫」に群がる求婚者 ≒ 「リリス(綾波レイ)」に群がる使徒

■普通の人だと思って追い詰めたんだけど「かぐや姫」の正体を知ってビックリの帝 ≒ 「アダム」だと思って追い詰めたのに「リリス」だと知ってビックリの渚カヲル

■「かぐや姫」を溺愛するお爺さん ≒ 「綾波レイ」を溺愛するゲンドウ
※そして両者は,“シンジ”に関わる人物という共通点もある(お爺さん=神事の役人,ゲンドウ=シンジの父親

■「かぐや姫」の「涙」 ≒ 「綾波レイ」の「涙」

■天人から「かぐや姫」を守るための自宅の要塞化 ≒ 使徒から「リリス」を守るための第三新東京市とネルフ本部

■お爺さんを振り切り,天の羽衣をまとって記憶をリセットし,本来の「天人」として月へ帰る「かぐや姫」 ≒ ゲンドウを振り切り,本来の体である「リリス」と融合し,ヒトを黒き月へと還元する「綾波レイ」

それ以外にも以下のようなものが.
■罪を犯したかぐや姫が嬰児になって竹の中に封印 ≒ 第一使途「アダム」を復活させたヒトの罪,そして「アダム」の胎児状への還元とベークライトによる封印

■謎の力により天人や飛ぶ車に矢が当たらない ≒ ATフィールドにより使徒に通常兵器は効かない

■不死の薬 ≒ エヴァによる永遠の命

■手紙と不死の薬を燃やして「富士山」に ≒ エヴァと融合して「人類の生きた証を永遠に残す」

そして2つの物語にとって重要なテーマである
■「月に還る」
「かぐや姫」は天人に導かれて月へ ≒ ヒトは「綾波レイ」に導かれて黒き月へ

以上,そんなところです.

かなり類似性が強いでしょ.

そういうわけで,件の学生が聞いてきた「あのストーリーで伝えたかったことは?」というのも,この2つの作品は似ています.

それは,
「排他と差別を乗り越える」
です(だと私は思っています).

かぐや姫って,当初から自分が天人であることを知っていたようですし,そうしたところからも,ずっと下界の人間を見下し,侮蔑していたんだと思います.群がる求婚者たちへの仕打ちはその現れだと思います.
でも,最後に帝やお爺さんにしたためた手紙では “天人” という自分の立場を嘆いています.
別れ際になって,帝への想いやお爺さんへの感謝の気持ちが強くなっている自分に気がついたのでしょうね.

それでも出自や立場には逆らえず,下界での記憶を消す機能がついた「天の羽衣」を着させられるシーンはあまりにも残酷です.
記憶を無くしたかぐや姫は,何事もなかったかのように「天人」の一人として月へ帰ります.
結構,悲壮感漂う物語なんですよね.

エヴァンゲリオンも同じです.
ヒトと使徒との確執.
自分と他者とを分つATフィールド.
パターン青(Blood type BLUE).
人類補完計画.
などなど,排他と差別,そしてそれを乗り越えるストーリー構成になっています.

結末としては,どちらかって言うと “20世紀版竹取物語” であるエヴァンゲリオンの方が “救い” がある物語なんじゃないかと思います.

この記事を書いていたら,もう一度この2つの物語をしっかり分析してみたくなりました.
         

2012年6月25日月曜日

独学で統計処理作業をスキルアップさせるための本

昨年からボチボチと 「統計」 に関する記事をいろいろと書いてきました.
統計学の原理原則や基礎的な考え方を紹介するのではなく(そんなサイトやブログは山ほどあるから),

「で,結局どういう作業をすればいいの?」

とか,

「統計処理ってSPSSとかExcelの関数や分析ツールに任せてるけど,そもそもどんな計算をしているものなの?」

という極めてマイナー,且つ,どうでもいい興味を持った人の視点で書いてきました.

でも,こういう需要は少ないながらもあるようでして,Googleとかで統計処理に関する適当な検索をかけたら私のブログのページが上位に上がってきます.
少し怖いです.


さて,
今回はそんな 「統計学に少しだけ興味があるけど,本格的には勉強したくない」 という人のために,“ほんのり甘い” 味がする統計学の書籍を紹介します.

食前酒用の度数の低い甘いワインみたいな本です.
調子にのってたくさん飲んだら気持ち悪くなるヤツ.
アレです.

ちゃんと書籍にあたって勉強すればいいものを,
「 Excel 多重比較 」
なんていう検索ワードをGoogleにかけ,私のブログで付け焼刃的な勉強を企む人でも分かりやすい本です.

まずは,
【 基礎勉強編 】
Jerry R. Thomas, Jack K. Nelson 著 田中喜代次・西嶋尚彦(訳) 『身体活動科学における研究方法』
統計処理だけでなく,研究方法も掲載されているので身体活動科学・スポーツ科学をやっている人は持ってて損はない.
t検定の式や統計学の考え方など,このブログではバッサリ割愛してるけど本当は知っとかなきゃいけない基本的な部分をおさえることができる.

永田靖 著 『統計的方法のしくみ』
内容としては上記の『身体活動科学における研究方法』における統計学の部分の上位版的な存在.舐めてかかると痛い目にあう.腰を据えて読む必要がある,正統で硬派な本.

石村貞夫・石村光資郎 著 『入門はじめての分散分析と多重比較』
まさに “Excelで多重比較する” ためにあるような本.読みやすい.

永田靖・吉田道弘 著 『統計的多重比較法の基礎』
上で紹介した『入門はじめての分散分析と多重比較』の上位版.Tukey法やSteel-Dwass法の手計算について詳しい.石村先生には悪いが,上のやつ買うくらいならこの本で十分だと思われる.

石村貞夫 著 『すぐわかる統計処理』
タイトルのようにすぐに分かるわけではないが,なんとなく分かった気になれる優れもの.ここで取り上げる “ほんのり甘い” というコンセプトからすれば名著.
よく院生や助手のところに舞い込む“不思議”で,“無理難題” なデータ分析作業を切り抜けるためにも,一冊あれば安心感が得られる「お守り」.

石村貞夫・デズモンド・アレン 著 『すぐわかる統計用語』
統計処理の辞書みたいな感じ.分からない用語が出てきたり,ド忘れした時に便利.持っといて損はない.けど,それ以上でもそれ以下でもない.無きゃ無いで大丈夫なんだろうが,私は結構助けられている.

松尾太加志・中村知靖 著 『誰も教えてくれなかった因子分析』
因子分析を知るためにはうってつけ.とりあえずSPSSとかで処理してみたものの,どう解釈すればいいのか悩むのが因子分析や主成分分析.学会や論文投稿での「因子分析について突っ込まれたらどうしよう」という不安と恐怖におさらばできる.

D・ロウントリー 著 『涙なしの統計学』
面白くないけど,大事なことを書いているので読んでおこう.実は名著として有名とのこと.なおさらしっかり読んでおこう.

浜田知久馬 著 『学会・論文発表のための統計学』
これもそう.退屈だけど重要なことを書いてある.修行だと思って読む.


次に,
【 んな事よりSPSSでの使い方を教えてくれればいいんだよ!編』 
岸学 著 『SPSSによるやさしい統計学』
一般的な自然科学系研究をする人にとっては,おそらく現時点で最強.「そもそも操作方法が分からない」という場合は,以下に紹介する書籍との組み合わせで行こう.

石村貞夫 著 『SPSSによる分散分析と多重比較の手順』
今は第4版が出ている.質も低いが敷居も低い.良いのか?悪いのか?と聞かれたら,その人のレベル次第だと言うしかないSPSSの「分散分析&多重比較マニュアル」といった趣旨の本.
とにかく作業しなきゃならない人にとっては,上記の『SPSSによるやさしい統計学』と合わせて読めば鬼に金棒.

川本竜史 著 『SPSSとExcelによる統計力トレーニング』
具体的な事例の数々.そのおかげでイメージしやすい.スポーツ科学系の人にとっては大変有益.重回帰分析や判別分析,クラスター分析まで丁寧に解説してくれているので,何かと重宝する.

小塩真司 著 『SPSSとAmosによる心理・調査データ解析』
浅く広い.それに分かりやすい.私としては,卒論の統計処理で学生への貸し出し頻度が高い本.とっかかりには最適かもしれない.
「Amosって何ですか?」っていつも聞かれるので,「怪物に変身できる仲間だよ」って答えることにしている.

加藤千恵子・盧志和・石村貞夫 著 『SPSSでやさしく学ぶアンケート処理』
なんでもそうなんですが,似たような本なのに「なんであっちの本には載ってて,こっちの本には載ってないの?」と困るもんだから,アレコレと複数買わないといけないのがHow to系の本ですよね.
ほぼ上記で紹介した本と同様な内容なのだが,これは「複数回答のデータ入力の方法」というのが載ってて助かった.それ以外は「おまけ」.

石村貞夫 著 『SPSSによる統計処理の手順』
これも1つ上で紹介した本のような立ち位置.一番最初に紹介した『SPSSによるやさしい統計学』の操作マニュアルみたいなものかな.

内田治 著『すぐわかるSPSSによるアンケートの調査・集計・解析』
これまた“そんな立ち位置”として購入した本.他のやつでは書いていない便利なことを書いておるんです.学生が卒論で実験せずにアンケート調査に“逃げる”からってんで購入した本シリーズの一つです.

では,
いい本が見つかったらまた紹介しますね.
                         

2012年6月23日土曜日

スチューデント化された範囲の表の補間

Tukey法とかSteel-Dwass法の計算をするのに,「スチューデント化された範囲 studentized range」の表を何度か紹介してきました.
以下の2枚です.

この表の「ν(自由度)」の数値ですが,例えば上記の表であれば「21」以降の数値は「24」「30」「40」「60」「120」以外の「α」値が分からない,という事になってしまいます.
Tukey法を計算したくても,N数が「43」とかだったらα値が分からないわけです.

そこで今回は,このスチューデント化された範囲の表に書かれていない自由度(ν)の部分のα値を算出する方法を簡単に示したいと思います.


今回の例としては,上記の有意水準5%の表で,【3群】で【 自由度(ν):22 】のところのα値を知りたいということにしておきます.

補間するために必要なのは,知りたい値の自由度に一番近い上下の「自由度」と「α」の値です.
今回の例で言うと,以下のような状況になります.
ということで,知りたい【 自由度:22 】のα値ですが,以下のように計算していきます.
一気に1つのセルで計算しきってもいいのですが,整理していきます.
まずは計算Aということで,このような式をどっかのセルに入れます.

=(1/B3-1/B4)/(1/B2-1/B4)*C2


お次は計算Bとして,こんな感じに.

=(1/B2-1/B3)/(1/B2-1/B4)*C4

それぞれエクセルの表中の数値を参照して計算していますので,知りたい値が変われば「スチューデント化された範囲」の表の値に合わせて各々の値も変わります.

最後に,C3のセルに計算Aと計算Bの値を合算しておきます.
ということで,

「3.55」が3群で自由度:22の時のα値です.

ちょっとした計算ですが,知っているとお得ですね.

参考文献:永田靖・吉田道弘『統計的多重比較法の基礎』

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.
 

2012年6月20日水曜日

Steel-Dwass法をExcelで計算する方法について,もう少し詳細に

昨日に引き続き,「スチューデント化された範囲の表」を使った多重比較ということで,Tukey-Kramer法の次はSteel-Dwass法です.

以前のSteel-Dwass法の記事である,
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
で紹介した例ですと,以下のような問題点があります.
その記事の最後でも触れましたが,

(1)各群データの繰り返し数(N数)が一緒でなければいけない
(2)同順位のデータ(同じ値)はどのように処理・計算するのか?

というものです.

この点につき,Tukey法については,昨日の記事で「Tukey-Kramer法」を紹介することで解決しました.
今度はSteel-Dwass法の番です.

細かいところについては,上記に示している以前の記事を読んでもらうとして,今回扱うデータは以下の様なものです.
以前のデータを少し変えています.
B列とF列に各群の元データ,C列とG列にそれぞれの組み合わせにおける数値の順位を示しています.
そして,D列とH列に,それぞれの組み合わせにおける数値の順位を2乗した値を示しています.この数値とその合計は,あとで出てきますので.

ちなみに,上から順に,「A群とB群」「A群とC群」「B群とC群」を比較しています.

以前の記事のデータと違うのは,B群とC群のN数が「6個」になっていることと,B群とC群に同値のデータ「24」が入っていることです.

さて,
まず一点目,「データ数が群によって違う場合について」ですが,見てお分かりのように,気にせず順位を付けていけばOKです.

二点目の「同順位のデータの処理・計算」ですが,三段目の「B群とC群」のところに示したように,「24」を両方共「9.5」番目として処理しています.
9番目と10番目に相当するはずだった値ですから(この表現で分かりますか?),その間をとって「9.5」にしているのです.

先に5%での有意水準を計算しておきましょう.
これは前回と同様です.
「スチューデント化された範囲の表」を見て,3群で自由度は∞.「3.31」を使います.
そしてこの値を,今回の例でも

=H29/SQRT(2)

として「2.341」にしています.

※「スチューデント化された範囲の表」は,
などの記事から取ってきてください.
さて,これから各群を比較していくわけですが,上記の画像でいうと左側の表を完成させることで可能になります.

まず,「E」のところですが,

E = 片方のN数 × (総N数+1)÷2

を計算します.
「片方のN数」といっても適当に群を選んではダメで,今回のような方法ですと,画像で言うところの左側の群の値を統一して使ってください.

「A群とB群」の組み合わせですと,
=5*(11+1)/2

です.
そんなふうにして,
A群とC群は,
=5*(11+1)/2

B群とC群は,
=6*(12+1)/2

と計算していきます.


次に「V」のところですが,ここが前回紹介したSteel-Dwass法と最も大きく異なるところでして,同順位の数値がなければ “あっち” の計算でもいいのですが,今回のように同順位があると,

V = 
片方のN数 × もう一方のN数 ÷ 総N数(総N数-1) × (片方の順位を2乗した値の合計 + もう一方の順位を2乗した値の合計) - (総N数 × (総N数+1)^2÷4)

という長ったらしい計算をしなければなりません.
スマートに計算式だけで表すと,
です.

例で言うと,
A群とB群は,
=(5*6/(11*(11-1)))*((D9+H9)-(11*(11+1)^2/4))

A群とC群は,
=5*(11+1)/2=(5*6/(11*(11-1)))*((D18+H18)-(11*(11+1)^2/4))

B群とC群は,
=(6*6/(12*(12-1)))*((D27+H27)-(12*(12+1)^2/4))

と計算していきます.
複雑ですね.


最後に,Steel-Dwassの検定統計量(t)の計算です.
A群とB群は,
=ABS((C9-C30)/SQRT(D30))

A群とC群は,
=ABS((C18-C31)/SQRT(D31))

B群とC群は,
=ABS((C27-C32)/SQRT(D32))

です.

というわけで,以下が統計処理結果.
先に計算した5%水準である「2.341」よりも検定統計量(t)が大きいのはA群とC群を比較した「2.556」.
ここに有意性が認められた,ということになります.

これで,群によってN数が違っていても,同順位のデータがあっても大丈夫ですね.


※統計的有意にこだわらないのであれば,
効果量(SE:effect size)をエクセルで算出する
がオススメです.

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.


エクセルや手計算でTukeyやSteel-Dwassによる多重比較をしたい方は,以下の2冊がオススメです.
 

2012年6月19日火曜日

繰り返し数(N数)が異なる群を,Excelを使ってTukey法で多重比較する

長いタイトルになり,長い月日が経過しましたが,そういうことをしてみたいと思います.
いわゆるTukey-Kramer(テューキー・クレーマー)法というやつです.

繰り返し数(N数)が同じ群でのTukey法による多重比較は,3ヶ月前に書いた
ExcelでTukey法による多重比較
をご覧ください.

というか,その続きとして書きますので,以下のエクセルの作業状況を写した画像を見て意味不明な人は,先に上記の記事を読むことを強くオススメします.


上記の画像は,
F12の【35.24】という値よりも,C12~17に示した値が大きれば,そこの組み合わせに有意性が認められる,ということを示したものです.
具体的には,A群とC群,C群とD群に有意性が認められています.


では,以下のような繰り返し数が異なるデータであれば,どのような計算をするのでしょうか?
というのが,今回の内容です.

以前のデータと違い,A群は5群,B群とC群は6群,D群は4群です.
以前紹介したTukey法ですと,全ての計算式を 【N数は5】 ということで統一していますので,今回のようにN数が異なる場合には採用できません.

以前のKramer法で用いる5%水準は,【スチューデント化された範囲の表】における,
※以下,その「表」.クリックしたら大きなサイズで見れます.

群数: 4
ν(データ数): 5
である,「 5.22 」を採用していましたが,今回のTukey-Kramer法では「ν」を,

総データ数 - 群数

の数値で読みとります.
今回の例題ですと,

21 - 4群 = 17

ですので,

群数: 4
ν: 17

である「4.02」を採用します.

以下がそのエクセルの画像です.
あと,C13~C18までの各群の組み合わせについては,以前と同様,平均値の引き算をABS関数で絶対値にしています.

で,この各群間の「平均値の差」を検定する「統計量」の計算式ですが,各群のN数が異なるので前回のような式では算出できません.
なので,組み合わせ毎に式の中でN数の違いを考慮したものを使います.

エクセルに入力するものとしては,

=4.02(表の値) × SQRT(分散の平均値 × (1÷i群のN数 + 1÷j群のN数))

です.
「i群」とか「j群」っていうのは,比較しようとしている2群のことを表しています.

順に,その式と入力済み画像を出していきます.

A群とB群
=F12*SQRT(G10*(1/5+1/6))

A群が5,B群は6だから,それに対応していることが分かるかと思います.


次はA群とC群
=F12*SQRT(G10*(1/5+1/6))

ここは条件は一緒だから,算出された値は変わりません.


A群とD群
=F12*SQRT(G10*(1/5+1/4))

ここはD群のN数が4なので,そのようになっています.


B群とC群
=F12*SQRT(G10*(1/6+1/6))

どちらもN数は6です.


B群とD群
=F12*SQRT(G10*(1/6+1/4))

こんな感じです.


最後にC群とD群
=F12*SQRT(G10*(1/6+1/4))


これらの値と,先に計算した「平均値の差」とを比べてみましょう.
これらの値よりも,「平均値の差」の方が大きければ,その組み合わせに有意性が認められるということです.

有意性が認められる組み合わせを赤字にしてみました.

さて,
例によって,Tukey法の算出方法はもう一つのあります.
多くは語りません.以下のようになります.
=C13/SQRT(G10*(1/5+1/6))

以降,先に紹介した計算式と同様です.
念のため,どのような計算をしているか書いておくと,

= ( i群平均値 - j群平均値 ) ÷ SQRT(分散の平均値 × (1÷i群のN数 + 1÷j群のN数))

この式で算出された値が,「スチューデント化された範囲の表」から取り出した【4.02】よりも大きければ,その組み合わせが有意であるということです.

式のカタチが違うだけで,算出しようとしていることは違いませんので,当たり前ですが結果は変わりません.
そんなわけで,以上です.

参考になるかもしれない関連記事を以下に示しておきます.
ExcelでTukey法による多重比較
ノンパラメトリック検定で多重比較したいとき
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)
Excelで多重比較まとめ
スチューデント化された範囲の表の補間

※統計的有意にこだわらないのであれば,
効果量(SE:effect size)をエクセルで算出する
がオススメです.

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.