注目の投稿

卒論・修論のための「統計」の部分の書き方

論文の「統計処理」や「統計手順」を書くことができずに悩んでいる人へ


データを統計処理して論文を書き始めたものの,「統計」の部分で止まってしまう学生は多いものです.

恥ずかしがることはありません.当たり前です.
論文を書いたことがない上に,統計手法や手順についても知らなかったのですから.


学生が悩むのは以下のようなものでしょうか.

1)「t検定を使った」と書きたいけど,どうやって使ったのか書けと言われた.
2)相関関係について書こうと思ったけど,ピアソンの積率相関係数というのは何? 普通の相関関係と違うの?
3)カイ二乗検定の書き方のために他の論文を読んでみたけど,いろいろな書き方があってさっぱり分からない.


実際のところ,論文の書き方は,研究領域や指導教員によって異なります.
卒論や修論ではなく,「研究雑誌」への投稿にしても,どこまで詳細に書くか,簡素化するか,については雑誌によって異なりますし,編集者・査読者(論文の掲載許可を出す人)にもよります.

つまり,「こうやって書くのが最も正しい」と言うことはできないのです.
なので,今回紹介するものを参考に書いてもらったあとは,指導教員や院生に書き方を教えてもらってください.


卒論や修論は,たいてい以下のような構成になっています.
(1)序論
(2)方法
(3)結果
(4)考察
(5)結論


その中でも,「統計」の部分を書くタイプの卒論や修論は,「方法」のところにそれを書きます.
多くの場合,以下のような構成になっています.
(1)対象(被験者など)
(2)測定方法(調査方法など)
(3)統計(統計処理)


例えば,「学部学科別の身長・体重の違い」という研究論文を書く場合は,以下のようになります.
(1)対象:「被験者」と題して,どこの学部学科の学生を対象にしたのか書くところです.

(2)測定方法:「身長の測り方(身長)」「体重の測り方(体重)」と題して,どのような測定器を使ったのか,どういう状態で測定したのかを書きます.

(3)統計:ここでデータの統計処理の方法について書きます.
今回の記事では,この部分の書き方を扱います.





(1)データについての記述


統計手法の記述に入る前に,データそのものの記述が入る場合がほとんどです.
例えば,一般的にデータを示す場合は「平均値」と「標準偏差」を用いますので,

データは平均値 ± 標準偏差で示した.
とか,
データはMean ± SDで示した.
などと書きます.
もちろん,実際にその論文内の本文(結果の部分)や表・図に示した方法で書きます.


あと,統計処理ソフトを用いている場合は,その旨をこの「統計」のところに書いておく必要があります.
今どき電卓を使っている人はいないはずなので,例えば,エクセルを使って分析した場合は,
データの分析にはMicrosoft Excel for Mac version 16を用いた.
と書きます.
統計処理専用のソフトであるSPSSなどを使っている場合は,
データの分析にはSPSS version 20を用いた.
と書きます.
なお,SPSSなどの専門的な統計処理ソフトを使っている場合は,「エクセル」を使ったことを省略している場合がほとんどです.
実際の作業においてエクセルを使ったかもしれませんが,それはデータの集計やグラフ作成であり,統計処理には使っていないからという理屈です.

ちなみに,「エクセル統計」を使っている場合は,インストールしているExcelのバージョンと「エクセル統計」のバージョンの両方を記述します.


なんにせよ,どんな方法で統計処理をしたのか読み手に解ればOKです.





(2)t検定の記述


対応のある/ないデータの違い
対応のある/ないデータについての詳細は,
t検定:対応のある/なしの違いは何か
をご覧ください.

対応のあるt検定の場合は,このような書き方になります.
各群の平均値の比較には,対応のあるt検定を用いた.
それだけでOKです.
「各群」というのを「各グループ」などと書き換えることができます.

対応のないt検定の場合は,F検定をする必要がありますので,書き方が変わってきます.
各群の平均値の比較は,F検定をおこない等分散性を確認し,対応のないt検定を用いた.

もし,F検定をおこなって等分散性が認められないデータを使っている場合は,
各群の平均値の比較には,F検定をおこない,等分散性が認められた場合はスチューデントのt検定を用い,等分散性が認められない場合にはウェルチのt検定を用いた.
これを簡略して書く場合は,
各群の平均値の比較には,F検定により等分散性の有無を確認したのち,対応のないt検定を用いた.
とします.
「F検定で等分散性を確認している」という記述により,その後の「対応のないt検定」は,スチューデントのt検定またはウェルチのt検定のいずれか適切な方を採用しましたよ,という含みをもたせた文章です.


比較対象によっては,対応のある/ないt検定を混ぜて書く論文もあります.
例えば,
介入前後の平均値の比較には,対応のあるt検定を用いた.文学部と社会学部の比較には,F検定により等分散性の有無を確認したのち,対応のないt検定を用いた
といった記述になります.

なお,統計処理としてSPSSという統計処理ソフトを用いている場合は,F検定ではなく「バートレット検定」です.
ソフトによって等分散性の検定に使っている統計手法が異なるので,出力データを注意深く確認してください.


あまり知られていないt検定で紹介した「1サンプルのt検定」の場合は,
測定したデータの平均値を「◯◯基準値」と比較するため,1サンプルのt検定を用いた.
「1サンプルのt検定を用いた.」で納得してくれない先生の場合は,

の数式を本文中に表示すればOKです.
つまり,
測定したデータの平均値を「◯◯基準値」と比較するため,1サンプルのt検定(式◯)を用いてt値を求め,有意性を検定した.
と書いて上記の式を書くのです.






(3)多重比較の書き方

多重比較の場合は,使った統計処理ソフトによっていろいろ違いが出てくるのですが,シンプルに書けば以下のようになります.

対応のあるデータの場合
同じ対象を3時点以上測って,それぞれの平均値を比較した場合です.
平均値の比較には対応のないt検定を用いた.多重比較にはボンフェローニ補正を行なった.
簡単に書けばこんな感じ.
ライアンの方法を使ったのなら「多重比較にはライアンの方法を行なった」と書き,Tukey法を使ったのなら「多重比較にはTukey法を行なった」と書きます.
参考までに,手計算による多重比較の方法はこちらを見てください.
Excelで多重比較まとめ
ExcelでTukey法による多重比較

一方,統計処理ソフトを用いている場合は,以下の記述でOKです.
平均値の比較は,対応のある一元配置分散分析により有意性を確認したのち,多重比較にはTukey法を用いた.
「でも私は,3群以上の分散分析だけでなく,2群間でのt検定もやってるんで,t検定の説明も加えたほうがいいですか」
という人がいますが,分散分析を2群間で行なったp値と,t検定のp値は同じ結果を示します.そういうものなので省略しても大丈夫です.
指導教員に言われたり,書きたい人は書いてもいいけど.


対応のないデータの場合
前述したような,身長・体重の平均値を文学部,社会学部,理学部で比較した,というケースです.
まず,「エクセル」だけで分析すると,エクセルには多重比較機能がありませんから,手計算による補正方法を記述することになります.
平均値の比較は,F検定をおこない等分散性を確認し,対応のないt検定を用いた.多重比較にはボンフェローニ補正を行なった.
統計処理ソフトを用いている場合は,以下の記述です.
平均値の比較は,対応のない一元配置分散分析により有意性を確認したのち,多重比較にはTukey法を用いた.

その他,二元配置分散分析の書き方とか交互作用のこととか知りたい人がいるかもしれません.
しかし,これについては複雑になってくるので紙面を変えて説明します.
※いつか記事を書いたらここにリンク先を入れます.





(4)相関関係の書き方

「相関関係」「相関係数」と簡単に言いますが,一般的に使われるそれは「ピアソン(Pearson)の積率相関係数」のことを指します.
なので,エクセルで「PEARSON関数」「CORREL関数」を使って算出した相関関係は,「ピアソンの積率相関係数」と記述しましょう.
エクセルでの簡単統計(相関関係)
記述例としてはこうなります.
測定データの変数間の相関関係は,ピアソンの積率相関係数を用いて分析した.
これでOKです.
いろいろと出回っている研究論文での書かれ方は,もっと違ったものになります.
例えば,
身長と体重の相関関係の分析には,ピアソンの積率相関係数を用いた.
といった感じ.
意味するところがわかるのであれば,自分なりにアレンジしてください.

なお,エクセル以外の統計処理ソフトを使って,「スピアマンの順位相関係数」や「ケンドールの順位相関係数」を使っている場合は,そのように記述してください.






(5)カイ二乗検定の書き方


期待値と実測値の差を示すカイ二乗検定は,分析したい「差」の期待値についてきちんと書いておかないと意味不明な統計処理になってしまいます.
複雑な分析をする場合には,そのあたりのことは事前に理解しておいてください.

ただ,一般的にカイ二乗検定を使う場合は,
アンケートだけで卒論・修論を乗り切るためのエクセルχ二乗検定
で紹介しているようなケースであることがほとんどです.

特に複雑な分析でなければ,
項目間の比較には,カイ二乗検定を用いた.
とだけ書いておけばOKです.






(6)効果量の書き方


日本版ウィキペディアには,まだ効果量(effect size)の記事がありません.
英語,中国語,フランス語,ドイツ語などにはありますので,なんだか昨今の研究教育現場の事情が透けて見えるようです.
Effect size (wikipedia:英語)

効果量を統計処理として活用するというのは,近年になって出てきました.
効果量についての詳細は,
効果量(effect size)をエクセルで算出する
を参照してください.

ですので,その算出根拠や判別基準については,CohenとSawilowskyの論文を引用することが良いと思います.
Statistical Power Analysis for the Behavioral Sciences(Jacob Cohen 1988)
New Effect Size Rules of Thumb(JMASMN 2009, Vol. 8, No. 2, 597-599)

測定値の比較のため,効果量を算出した.評価基準にはChohenとSawilowskyの基準を用いた.

と書きます.引用方法は卒論や修論の書式に従ってください.






(7)相関係数の差の検定の書き方


相関係数の差の検定は,卒論・修論で測定データに「有意差」が出なくて困った時に多く用いられる手法です.
相関係数の差を検定したいとき
対応のある相関係数の差の検定
基準となる相関係数との差を検定するしかし,その記述方法に困っている学生(と指導教員)も多いのではないでしょうか.

「対応のない相関係数の差の検定」と「基準となる相関係数との差の検定」の場合
これらの方法は,相関係数をZスコアに変換(フィッシャーのZ変換)することで,比較する相関係数の有意性を検定しようとするものです.
相関係数の差を検定するため,相関係数をZ変換して有意性を確認した.
と書くか,
相関係数の差を検定するため,御園生らが示す方法を用いて有意差を確認した.
と書きましょう.
その参考文献はこちらです.



対応のある相関係数の差の検定の場合
こちらは,算出方法が比較的新しく開発されたものです.
以下の文献を使ってください.
Comparing correlated correlation coefficients(Meng, X.-l., Rosenthal, R., & Rubin, D. B. (1992). Psychological Bulletin, 111(1), 172-175.)
相関係数を比較するため,Meng-Rosental-Rubinによる相関係数の差の検定を行なった.





(8)有意水準を書く


君が参考にしている研究論文を読んでもらえば,どれにも書かれているのが「有意水準」です.
たいてい,「統計」の部分の最後の方に書かれていることが多いです.
簡単な文章ですが,最大に大事なところなので省かないでください.
有意水準は5%未満とした.
多くの場合,5%です.
ちなみに,これを10%とか1%にする研究もあります.
統計処理の種類や分析対象に応じて変えることもあります.

でも,そういう研究の場合は指導教員から事前に指導が入っているはずなので,それについてこの記事では割愛させていただきます.

その他多くの学生は,とりあえず「有意水準は5%」と書いてください.






(9)まとめ


試しに,これまでの文章を全部書き連ねてみました.
以下のような文章になります.
データは平均値 ± 標準偏差で示した.データの分析にはMicrosoft Excel for Mac version 16を用いた.平均値の比較は,対応のない一元配置分散分析により有意性を確認したのち,多重比較にはTukey法を用いた.測定データの変数間の相関関係は,ピアソンの積率相関係数を用いて分析した.相関係数を比較するため,Meng-Rosental-Rubinによる相関係数の差の検定を行なった.有意水準は5%未満とした.
「それっぽいけど,なんか文章が変」と思った君は優秀です.

実際のところ,文章の前後関係に合わせて書き方を調整する必要があります.
それに,研究方法に合わせた文章にもした方がいいですね.

例として,冒頭で示した「学部学科別の身長・体重の違い」を想定して書いてみます.
すべてのデータはMicrosoft Excel for Mac version 16を用いて分析し,平均値 ± 標準偏差で示した.学部学科別の身長と体重の比較は,対応のない一元配置分散分析により有意性を確認したのち,Tukey法により多重比較を行なった.身長と体重の相関関係は,ピアソンの積率相関係数を用いて分析した.学部学科別の相関係数を比較するため,Meng-Rosental-Rubinによる相関係数の差の検定を行なった.いずれの統計処理も,有意水準は5%未満とした.
さらにそれらしくなりましたね.

それっぽく書くためには,参考にしている研究論文をたくさん読むしかありません.
その上で,指導教員から添削を受けることです.






(10)「統計」の部分を書く上での留意点


研究論文全体に言えることですが,「自分とは別の他人が,これを読めば同じ調査・実験をやれるように書く」ことが大事です.
統計処理について,何から何まで全部書く必要はありません.
研究をする人であれば当たり前のことで,誰もが知っていることは省略してもいいですが,その判断基準は結構微妙です.
この記事を読んでもやっぱり分からないところは,指導教員に尋ねましょう.

指導教員も相手してくれなくて,どうしても困ったという時はメールください.
なるべく早めに返信します.




その他,卒論・修論の統計の部分を書く上での参考になる書籍はこちら.
  


SPSSやRを使えない人は,これを持っとくか図書館で借りとけば結構便利.
   


エクセルの基本機能だけではしんどいけど,高い統計処理ソフトは購入できない人はこちら.
 

大学教員になる方法も紹介しています

大学教員になる方法
大学教員になる方法「強化版」
大学教員になる準備


関連記事
卒論・修論のための「統計」の部分の書き方
【やってはいけない】卒論・ゼミ論を1日で書く方法
【卒論・ゼミ論】絶望的な君が無理矢理「急成長」する方法
卒論・ゼミ論で統計学的有意差が出なくて困っている時に読むブログ記事
t検定:対応ある/なしの違いは何か
アンケートだけで卒論・修論を乗り切るためのエクセルt検定
アンケートだけで卒論・修論を乗り切るためのエクセルχ二乗検定
エクセルで相関係数のp値を出す
エクセルでの簡単統計(相関関係)

コメント