2014年8月31日日曜日

エクセルだけで統計処理する卒論・ゼミ論用アンケート調査のオススメ方法 part2

前回の,
の続編です.
基本的なところは前回書いていますので,そちらも合わせてご覧ください.

では,さっそく続きです.

以下の様なアンケート調査をしたがる人が多いので,その留意点.

5)その人が思う「程度」を質問したいとき
分析の仕方によっては問題ないのですが,以下の様なケースは問題です.指導教員がちゃんとした先生だったら怒られます.
どういうケースかというと,例えばこういう質問用紙を作って,
で,それを以下のようにエクセルに入力して,
「どうやって分析しようかなぁ.あっ,そうだ」ということで,
と,このように平均値を出して,
「この試食料理の評価点は,2.7ポイントだ.まぁまぁと言ったところかな」
「そうだ,この点数を別の試食料理と比較しよう.t検定が使えるじゃないか」
という分析をしてしまうことです.

こういうの,非常に多いので気をつけてください.
いい加減な指導教員なら「なるほど」と言って済ますのですが,たいてい大目玉を食らうので注意が必要です.
この質問方法の場合だと平均値をとったり,その値を比較したりはできません.「非常に美味しい」がX人,「具材が変われば」がY人,「そもそも・・」がZ人でしたぁ,っていうような分析しかできないんですよ.

では,平均値をとりたい場合,どうすればいいのか.
質問用紙はこのようにします.
こういう聞き方であれば,あとでそれの平均値や標準偏差をとることができます.
これを「順序尺度」といいますが,まぁこれは覚えてなくても分析はできます.
「もうちょっと詳しく聞きたい」というのであれば,例えば,
こんなような感じにして,いろいろ工夫できます.

「1〜5の5段階じゃなきゃダメなのか?」というところでしょうが,別に3段階でも10段階でも構いません.
そこらへんを考慮したビジュアル・アナログ・スケール(visual analog scale: VAS)というのもあります.
細い線に見えるところは,ホントに「線」です.
で,この線上に対象者が思う感覚の程度の部分に印をつける(交差する線を1本書かせるやり方が便利)というもの.
こんなふうに(もちろん赤ペンでなくても良い).
んで,その印までの距離を定規で計測して,その長さをデータとして採用するというものです.こんな感じに.
集計と解釈の都合から,10 cmの線を採用することになります.上記の例だと76 mmですので,「76」というデータになります.つまり,100段階尺度ということです.
VASの詳細については,ウィキペディアの英語版のところに以下の参考文献があったので,これをご覧ください.

このVASですが,どうしてもこれを利用して回答させなければいけない質問というのは,実はそれほど無いというのが実際のところです.かなり繊細な違いを確認したい場合(気分や痛み,温度といった感覚など)に採用されることが多いのでしょう.

それに,集計作業がとてつもなく煩雑であることも覚えておいてください.
VASの専用ソフトを使わない限り,いちいち定規を当てて読み上げなきゃいけないので,かなりシンドいですよ.

私が学生の時,このVASを使ったスポーツ飲料摂取による体調調査をしたことがあります.対象者は約300人,VASによる質問も一枚あたり20項目くらい,その調査もプレ,ミッド,ポストの3回を用意していました.
先生から「早くやれよ.遅いぞお前ら」と言われて提出締切に追われ,クリスマスムード漂う街を尻目に,友人と2人で深夜まで,
「44,25,36,12,18,56,77,89,65,73,58,65,16・・・,はい次ぃ・・」
と,黙々と集計していたことは一生忘れません.
おかげで2人ともテンキーのブラインドタッチが出来るようになりました.
(あっ,そうか.きっと先生はそれを狙って・・,なわけないか)


次は,「上位◯個まで選べ」的な質問をしたい場合です.
6)もうちょっと複雑な複数回答の集計
こういうの.
この場合,エクセルにはこんな感じにしておきます.
B列が1位,C列が2位,D列が3位の回答です.
それを合算集計するわけですが.
前回の集計方法を覚えていれば,それに準じたらOKですね.端折って示します.
「COUNTIF」関数を使ってオートフィルで,上図のようにします.
そして回答総数を「COUNTA」関数あたりを使って出して,
それを使って以下のように,前回の記事のような単純な分析をすることができます.
でもこれだと,「上位3つの回答数」とその割合を知ることができますけど,せっかく1位から3位まで順位付けて回答してもらったのに勿体ないわけです.

その集計方法ですが,まずは下準備.
E〜G列の9行目のところに,1,2,3と数値を入力しています.

んで,以下のようにします.
E列10行目のところに,
=COUNTIF(INDEX($B$2:$D$7,0,E$9),$B10)
と入力します.
「$」マークを入れるところ,間違えないように気をつけてください.

で,これをオートフィル.
これで,E列に1位に選ばれた数,F列に2位の数,G列に3位の数が出てきたわけです.

この例であれば,
「単純集計すれば「口コミ」が最も多い(6件)が,順位付けしてみると1位には「テレビ」が多い(4件)」
といったことが見出だせるのです.

今回はここまで.この続きはまた次回に.


関連記事
アンケート結果を統計処理する場合はこちら
エクセルExcelでΧ二乗検定を part3

信頼性係数を出す場合はこちら
信頼性係数をエクセルで算出する

アンケート調査をきっちり勉強したい場合は以下をどうぞ.
 

その他,統計処理のまじめな勉強はこちら
独学で統計処理作業をスキルアップさせるための本