クリタマです。
このエントリーでは
「なぜに人はデータを分析するのか」というテーマでお送りいたします。
ちなみに、今回は「知識習得」というより、「実技」に焦点を置いているため、
- 分析手法は知っているけど具体的な使い方がよくわからない
- 分析に合わせて目的を変換する方法がわからない
このような悩みのある方には参考になるのではないでしょうか。
統計データを分析する目的は?
今日も結論ファーストでいきましょう。
データ分析をする目的・・・
それは仮説と結果が一致しているかを判定するためです。
例をあげますね。
僕自身は、心理学研究のために統計を学んでいるわけですが、
「健常者とうつ病の人の違い」というテーマで研究を考えたとします。
で、この研究において、両者の主たる違いを、「精神的健康の程度」で捉えた時に、(つまり、健常者は精神的健康が高く、うつ病者は精神的健康が低い)全く同じような環境で生活していても「うつ病」になる人とそうでない人がいるでしょう。
では、この違いは一体なんなのでしょうか?
この様な疑問がまずは出発的になるわけです。
するとお次は、その「精神的健康」を高低をわける要因はなんなのか?
ということを考えるわけです。
で、これも仮ですが、先行研究のレビューから、「他者意識」という要因が「精神的健康」に影響を与えているという可能性があるという知見が得られたとしましょう。
他者意識というのは、「他人の発言が気になる」、とか「他人の変化に敏感」とか「他者に対する意識」とでも言いましょうか。
詳しく知りたい方は、以下の文献を参照してください。
「他者意識」とは、他者へ向ける注意、関心、意識などをいう. (辻,1989,1993),
引用:被害妄想的心性と他者意識および自己意識との関連について
ここで言いたいのは、「他者意識」と「精神的健康」の関係を探りたいわけです。これがこの研究における最終ゴール、つまり、目的です。
しかし、これだけでは、まだ漠然としすぎています。
ゆえに、この漠然とした目的をブレイクダウンすることで、より具体的にする必要があります。
目的① 2つの要因(変数)の関係を探る
例えば、今回の疑問は、「他者意識」が「精神的健康」に影響を与えている仮説の大元は、
『「健常者」と「うつ病」の精神的健康に影響を与えている要因は何か?』という疑問から出発しています。
つまり、
『「健常者」と「うつ病」者の精神的健康の程度が異なるのは、「他者意識」が影響しているから』という主張をしたいわけです。
これをさらに言い換えると、
『「他者意識」という要因と「精神的健康」には何かしらの関係がある』ということになるのですが、
このように、「2つの要因の関係」を探ろうとする場合に、「相関分析」という手法が統計にはあるので、「散布図」や「相関係数」を求めようという話になるわけです。
目的② 2つのグループにおける要因の違いを探る
また、仮に、この2つの要因に、「相関」があるとしたら、つまり、「他者意識」が「精神的健康」に影響を与えているのだとしたら「どのように影響を与えているのか?」ということを具体的に考えることができます。
例えば、僕は、うつ病の人たちは、「周りからの意見を気にしすぎている」という情報が先行研究からわかったとしたら、
- うつ病者は、健常者に比べて、「他者意識」が高い
- 健常者は、うつ病者に比べて、「他者意識」が低い
という仮説を立てることができます。
これをさらに統計分析的な「言い回し」に変換すると
- 「健常者とうつ病者における、他者意識の程度には差がある(違いがある)」
と、こんな感じになります。
すると、このような2グループ間のある要因の影響の違いを分析するために、統計学には「t検定」という手法がありますので、それを採用しようとことになるわけです。
仮説(目的)に対して結果を検証するのが分析の意味
この様に、研究における統計のデータ分析は通常、仮説があった上で、その事実を検証するために行われるということです。
そのためには、「データ分析をしたらこんな結果が得られた」だから、「こういう仮説にして研究を進めよう」という後付けでは、いきあたりばったりなものになってしまいます。
個人的には、そういう研究があってもいいとは思いますが、ですが、お金がかかったり、人の力を借りたり、倫理的な問題とかが絡んでくると、そういう適当なことになってはいけないということなのでしょう。
とにかく、統計でデータを分析するというのは、あくまでも「手段」なのだから、「目的ありき」という考え方が重要ということですね。
目的に応じた統計分析手法
参考までに目的の一覧です。
- 全体像を知りたい
- データの位置を知りたい
- 割合を見たい
- データの値を比較したい
- 変化を見たい
- 関係を知りたい
- 予測したい
で、最後に、目的別、統計分析手法の一覧を図で示しておきたいと思います。
統計解析には、以上の様な手法がありますが、このエントリーで強調しているのは、
「目的を明確にする」ということです。
そこんとこお忘れなく。
それでは。
参考書
①p値とは何か
②統計学がわかる ③やさしく学ぶ統計の教科書 ④よくわかる心理統計
コメント