この記事は、心理系大学院生を対象とした統計法の学習ページです。
- 重回帰式が母集団の予測に使えるかどうか、どうやって判断するの?
- 決定係数が高ければそれでOKなの?
- Excelでの検定方法がよくわからない
こんな悩みや疑問がある方はご参考ください( ˘ω˘)
重回帰式が母集団の予測に適用できるかどうかを検定する
重回帰分析の読みとりにおいて、重回帰式の精度を調べる指標として決定係数があることがわかりました。
ただし、決定係数が高いからといって、その重回帰式が母集団を予測する上で適切か否かはまだわかりません。
なぜなら、決定係数の精度というのは、あくまでも、標本のデータに関しての話だから。
つまり、重回帰式の検定を行う必要があり、その検定方法を今回は紹介していきます(^^)
検定には2つ種類があり、どちらもExcel行うことが可能です。
具体的には以下の2つです。
- 棄却限界値を調べる方法
- P値を調べる方法
①棄却限界値を調べる方法
1つ目は、棄却限界値を調べる方法です。
基本的な考え方は以下の通りです。
Frが棄却限界値よりも大きいかどうかを調べ、大きければ決定係数は有意、すなわち重回帰式は母集団に適用できると判断する。
(引用:例題とExcel演習で学ぶ多変量解析、P111, 2-3行目)
これは、つまり、統計的仮説検定をしましょうということでです。
基準値を設定して、それを上回るか下回るかによって、判断をするということです。
統計の基礎でやってきたこととと同じですね。
Excelでの実践手順
では、アドイン機能を使って出力した↓↓こちらの結果を使って実際にやってみましょう(^^ゞ

具棄却限界値を求めるには「=FINV関数」を使います。
( )内は以下の様に設定します。
- =FINV(0.05, 回帰の自由度, 残差の自由度)
つまり、具体的には出力結果の分散分析表の赤枠の部分をみます。

したがって、
- =FINV(0.05, 2, 3)
となるわけです。
これを計算すると、「9.55」といった値が返ってきます。
つまり・・・
- 棄却限界値=9.55
ということですね!
Frとの比較
これでFrが棄却限界値より大きいかどうかを調べることができます。
Frというのはこれのことです↓(観測された分散比)

これと棄却限界値を比べると
- 40.33 > 9.55
となるなので、「Fr > 棄却限界値」です。
従って、帰無仮説は棄却されます。
そして、ここでの帰無仮説と対立仮説は次の通りです。
- 帰無仮説 → 決定係数は0である。
- 対立仮説 → 決定係数は0ではない。
つまり、対立仮説が採択されることになるわけです。
この結果をもって、とりあえず「この重回帰式から母集団のデータを予測することができそうだ」と言えることになります。
ただし、
対立仮説を採択できたからといって決定係数が高いということではありません
(引用:例題とExcel演習で学ぶ多変量解析 P111, 最終行)
そのため、決定係数が統計的に意味あるものかどうかぐらいのニュアンスで捉えておくと良い。
以上が1つめの方法ですね。
P値を調べる方法
P値による検定の考え方が以下の通りです。
F分布のグラフにおいて、横軸がFrとなる上側確率を求める。この値をP値といいます。P値が有意水準0.05(5%)より小さければ、決定係数は有意で、重回帰式は母集団に適用できると判断します。
(引用:例題とExcel演習で学ぶ多変量解析 P111, 4-6行)
Excelでの実践手順
これも先程のデータを使う。
P値を求めるには「=FDIST関数」を使います。
( )内は以下の様に設定します。
- =FDIST(分散比, 回帰の自由度, 残差の自由度)
分散分析表でいうと↓こちらの赤枠部分です。

従って、
=FDIST(40.327, 2, 3)
こうなります。
すると、「0.006791」といった値が返ってきます。
つまり、これがP値ということですね。
検定結果の判断
仮に有意水準を5%に設定しておくと
「0.006791 < 0.05」となるため、帰無仮説を棄却することができます。
よって、重回帰式は母集団に適用できると考えられるわけです。
ちなみに、この「0.006791」という値
見覚えがないでしょうか?
そうです!
実は、分散分析表の↓ここに記載があります。実は。

つまり、「有意F=p値」のことを言っているわけですね(笑)
出力結果の読み方を学びたい方は↓↓こちらから
まとめ
さて、いかがでしたでしょうか?
重回帰式の母集団への適用可能性について、検定方法の理解は深まったでしょうか?
最後に本記事の内容を振り返っておわかれです(^^)/
- 決定係数が高くても、それは標本データに関しての話なので、母集団予測に使えるかは検定が必要
- 検定方法は2つ:①棄却限界値を調べる方法、②P値を調べる方法
- ①の方法では、FINV関数で棄却限界値を求め、Fr(観測された分散比)と比較する
- ②の方法では、FDIST関数でP値を求め、0.05(有意水準)と比較する
- どちらの方法でも、帰無仮説が棄却されれば重回帰式は母集団に適用できると判断できる
- p値は、分散分析表にデフォルトで記載がある
ということなんですね~
それではまた(^^ゞ
統計法を動画で学びたい方は
こちらの記事に「動画視聴希望」とコメントください(^^)
クリタマ勉強部屋から動画URLを配信いたします♪
参考
こちらの記事を作成にする上での参考文献です(^ω^)
①多変量解析がわかる
②多変量データ解析法
③例題とExcel演習で学ぶ多変量解析



コメント
音声ありの解説でありがたいです。ありがとうございました。
動画視聴希望
統計関連でここにたどり着きました。よろしくお願いします。
>edoさん
コメントありがとうございます^^
動画URLをお送りしています♪