2014年8月30日土曜日

エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方法 part1

簡単なアンケート調査をやって卒業論文とかゼミ論文に持ち込みたいと考えている4年生は多いものです.
アンケート調査なら作るのも取るのも簡単だし,集計してグラフや表にして出せばOKだろう,などと浅はかにも企んでいることかと思います.

ところが,そうした学生も12月近くになってから後悔するんです.
「先生,出来ました.こんなデータが出ましたよ」って意気揚々と報告すると,指導教員から「じゃあ,そのデータをちゃんと統計処理にかけてから解釈を論述してね」って言われ,「はて?統計処理ってなんぞ?データを統計処理にかけるって,どういう意味なのか分かりません」という状況になり,ちょっとくらい悩んだフリはするものの,そのまま提出間際まで放ったらかしてギリギリになってからバタバタするも,やべぇ,明後日が提出締切なのにコンビニのバイトが詰まっててパソコンの前に座る時間が無いぞぉ,というパターンが日本中,いえ世界中の大学で繰り広げられているわけです.

今回の記事では,統計処理をエクセルだけでやるというニッチなものではなく,「きっちり統計処理しなければいけないのに,残念ながら社会的重要度は低いアンケート調査」つまり,卒論やゼミ論用のアンケート調査を作成する上であらかじめ知っておいたほうが良いことをご紹介しておきます.

断っておきますが,ここで紹介するのは「統計処理が簡単になるアンケート」であって,「意義深い情報を得るためのアンケート」ではありません.
意義深い情報を得るアンケートを作成したのであれば,指導教員やアンケート調査をよく知っている人と事前にみっちり相談しながら進めてください.

往々にして学生は「パソコンは持ってるけど,統計処理ソフトは大学に行かないと使えない」ということでしょう.ですので,コンビニのバイト中でも隙を見つけて待機室で統計処理できることを前提としたアンケートにしています.
※その様子をTwitterで流したりしないようにしましょうね.

なお,エクセルでのアンケート結果の統計処理方法については,
エクセルExcelでΧ二乗検定を part3
を見てください.

記事を書くにあたって下書きしてみたら,結構なボリュームになりそうだったのでシリーズ化して書くことにします.今回はパート1.

ではさっそく、
1)年齢,男女,学年,職種などのデータは,紙面が許すだけ,思いつく限り用意する
こういうのを「対象者の属性に関する問い」などと言います.取っておいて損はありません.あとになっていろいろとグループ分けしたくなるものです.可能な範囲で取っておきましょう.
でも,あんまり多いと回答者が面倒くさがってくるので,ほどほどにします.
以降で紹介することとも関係するのですが,できれば選択式,数値回答式にすることで回答者の負担が減ります.

つまり,こういうこと.
2)自由記述欄はつくらない
それが大事です.
「このアンケートを受けた感想」などといった,どうでもいい記述スペースであれば大丈夫なのでしょうが,以下のような問い方はダメです.

「あなたの職業は?」とか「部署は?」と回答者に記述させるのもダメ.
あれだけ言っても上記のような質問欄を作る学生がいます.苦労するのは自分自身(と,回答者)なのですが.
作るとすれば,以下のようにします.


3)回答方法は選択式の番号で


その中から当てはまるものを1つだけ選べ,というようにするのです.
上記の質問例のように,もの凄く幅広いものを回答させる質問項目であっても,可能な限りシンプルな回答結果になるよう配慮します.
「タイ料理が好きという人はどうするんだ.中華の中でも四川料理じゃなきゃダメだという人はどうするんだ.おい,トルコ料理が無いじゃないか」なんてことも出てきましょうが,そこを頑張って出来るだけ少ない選択肢に絞ってください.

役所のアンケート用紙とか健康診断の記録紙なんかが参考・お手本になるので,それを手に入れてみることをオススメします.

で,エクセルへの入力について.
エクセルへの打ち込み作業では,以下のようにその該当する番号を打ち込めばOKです.
いちいち「和食」とか「その他」なんて書き込む必要はありません.でも,これをいちいち入力する学生が100人中3人くらいはいるので,自分がその一人にならないよう,今のうちに覚えておきましょう.

なお,あなたに友達がいるようでしたら,「読み上げ係」と「入力係」の2手に分かれて,
「1」「はい」,「4」「はい」,「5」「はい」,「1」「・・あ,ゴメンQ4から」,「1」「はい」,「6」「はい」・・・・・・
という感じで打ち込み作業をすれば,圧倒的な速度を得ることができます.感動しますよ.
学友は大事だと痛感します.冗談抜きで,卒論・ゼミ論を履修する意義の一つだと思います.

とまぁ,エクセルへ入力するとこんな感じになります.
その番号ですが,これは「COUNTIF」という関数を使って集計します.
集計の前にまずは仕込み.回答項目とその番号を以下のように入力します.
そして,こんな感じにしていきます.
ここではC列9行目のところに,
=COUNTIF($B$2:$B$7,B9)
と入力しています.
これをオートフィルすると,
めでたく,和食が2人,洋食が3人,中華とイタリアンはゼロ,その他が1人ということが集計できました.
その後どうするかですが,例えば,
この場合,D列9行目に
=C9/SUM($C$9:$C$13)
と入力しています.これをオートフィルすれば,
和食を選んだ人が33%,洋食が50%,その他は17%というように,比率を計算することができます.


4)どうしても複数回答をしたければ,こんなふうに集計する
「どれか一つだけなんて実際的じゃないよね.だから・・」ということで,たしかどっかで見たことがあるぞと思いつき,意気揚々と「複数回答」を作りがちですが,複数回答の統計処理やエクセル処理は厄介です.
可能な限りシンプルなもので質問紙を作成したいのですが,それでもやっぱり「複数回答」がいいという場合もいるでしょう.

で,複数回答の集計で初心者がやらかすのが,これ.
カンマ「,」とかピリオド「.」,句読点やハイフンなどで,一つのセル内で一括して集計しちゃうというもの.結構な数の学生がやります.
別にこの状態から分析ができないわけじゃないのですが,ここは一つ,初心者は以下のように集計することをオススメします.
上の図と同じデータであれば,こんなふうになります.
例のように5つの選択肢であれば,「Qx-1〜5」というようにします.
そこに,回答していれば「1」を.回答していなければ空欄,または「0」を入れるというものです.
そして,
ここの例ではB列8行目のところに「合計」を出しておきました.

では次に,各項目ごとの回答数を算出します.
この例では,C列9行目のところに

=SUM(INDEX($B$2:$F$7,0,B9))
という関数の組み合わせを入れています.

で,これをオートフィルすると,
このように,各項目の回答数が集計できます.
んで,これをこのように,
合計数で割るようにしまして.

あとはオートフィル.
めでたく全体回答数に対する各項目の回答数の割合が算出されるということです.

とりあえず,この記事ではここまで.
続きは次回.


※で.続編の記事はこれ.
エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方法 part2
エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方法 part3

アンケート結果を統計処理する場合はこちら
エクセルExcelでΧ二乗検定を part3

本当はやらなきゃいけない「信頼性係数」を出す場合はこちら
信頼性係数をエクセルで算出する

アンケート調査をきっちり勉強したい場合は以下をどうぞ.
 

その他,統計処理のまじめな勉強はこちら
独学で統計処理作業をスキルアップさせるための本