エクセルを使った分散分析のやり方まとめ~関数を使って~

統計法

クリタマです。

本エントリーでは「エクセルを使って実際に分散分析をやってみたい」と思います。

それでは本日もよろしくお願いします。

まずは、ローデータの確認

今回分散分析に使うローデータは、こちらになります。

全国からランダムサンプリング によって抽出された「健常者・精神障害・発達障害」の協力者に対し、他者意識アンケートを実施した結果です。

(もちろん架空データ)

これを使って、属性(健常・精神・発達)によって、他者意識の平均値に統計的な差があるかどうか検定するのです。

平均値と標準偏差を求める

それでは、例のごとく、各グループの平均および標準偏差を求めましょう。

以下のようになります。

これまで標準偏差

偏差を求めて、2乗して、それらの総和の平均を求め、さらにその平方根を算出する

というやり方で求めてきました。

しかし、ここではエクセルの「STDEV.P」関数を使って一気に算出してやりましょう。

計算するとわかりますが、、「偏差を求めて、2乗して、それらの総和の平均を求め、さらにその平方根を算出する」というやり方で求めた値と一致します。

各グループの”群内のズレ”、すなわち平方和を求める

では、精神・発達・健常の「他者意識の平均点」が求められたところで、各グループの群内の平方和を計算します。なぜなら、それこそが、分散分析で必要な「群内のズレ」だからです。

  • 「群内の平方和(ズレ)ってなに?」
  • 「なぜ群内の平方和(ズレ)を求めるの?」

という方は、↓↓こちらのエントリーを参照

分散分析の考え方をわかりやすく伝えるためにイメージ化してみた
本記事は↓こちらへ移管しました。 こちらのページも近々削除します。 予めご了承ください。

話を戻します。

群内の平方和というのは、これまで散々やってきましたが

  • (各データーグループ平均 )の2乗の総和

のことを意味します。

ということは、各グループの分散を求めてその値にデータ数を掛けることで導き出せます。

なぜなら、「平方和の平均=分散」だからです。

ですので、各グループの分散をまずは求めることにしましょう。

分散は、エクセル関数の「VAR.P」を使って算出します。

結果は以下の様になります。

分散

あとは、これらの値(分散)にそれぞれのサンプル数(今回は全グループ「15」)を掛ければ、それが「群内のズレ」ということです。

↓↓こうなりますね

したらば、これらが各属性ごとの「群内のズレ」ということは、これらを全て合算したものが、「全体の群内のズレ」ということになります。

ということで、その結果が赤枠で示した「1310.93」という値です。

次に、群間のズレを求める

「群内のズレ」が求められたところで、お次は「群間のズレ」を計算する必要がありましたね?

この意味がわからないという方は↓↓を参照

分散分析の考え方をわかりやすく伝えるためにイメージ化してみた
本記事は↓こちらへ移管しました。 こちらのページも近々削除します。 予めご了承ください。

「群間のズレ」は言い換えれば、「群間の平方和」ということであり、

つまり、「全体平均と各グループ平均との差の2乗」×サンプルサイズ

を求めろという意味です。

というわけで、全体の列の空欄を埋めましょう。

すると、↓↓こうなります。

ちなみに、サンプルサイズは、「16×3」で「48」です。

これで、準備が整いましたので

  1. (各グループの平均-全体平均)
  2. 上記値の2乗
  3. 2乗した値×サンプル数

の順番で計算を進めます。

すると、下図の赤枠のようになります。

これは、健常者の値なので、同様に、精神障害と発達障害の値も求めるというわけですね。

ということで、以上が、各グループごとの「群間のズレ」ということになりますので、これら3つを合算すると「全体の群間のズレ」ということになります。

その結果が以下です。

これで、「全体の群内のズレ(平方和)」と「全体の群間のズレ(平方和)」が出揃いました。

これで分散分析をすることができます。

ただし、両者の値の正誤を確認しておきます。

つまり、

  • 全体の群内のズレ+全体の群間のズレ=全体のズレ(平方和)

と一致しているかを確認するということです。

この意味がわからないという方は↓↓を参照

分散分析の考え方をわかりやすく伝えるためにイメージ化してみた
本記事は↓こちらへ移管しました。 こちらのページも近々削除します。 予めご了承ください。

そのために、まず全体の平方和の値を確認します。

全体の平方和(ズレ)は、「分散×サンプル数」で求めるんでしたね?

  • 全体の分散・・・「179.488」
  • 全体のサンプル数・・・「45」

なので、「179..488」×「45」を計算し、「8077」という値がえられます。

あとは、全体の群内のズレ+全体の群間のズレ=全体のズレ(平方和)

の値がこ「8077」に一致するかを確かめるだけです。

  • 郡内のズレ・・・1310.93
  • 群間のズレ・・・6766.04

でこれらを足し合わせると、「8077」になります。

ちゃんと一致してますね?

これで、分散分析をするための材料が揃いましたから、分散分析表を作成することができます。

参考書

①p値とは何か

②統計学がわかる ③やさしく学ぶ統計の教科書 ④よくわかる心理統計  

コメント

タイトルとURLをコピーしました