この記事は、心理系大学院生を対象とした統計法の学習ページです。
- 「偏相関係数って結局なんなの?」
- 「計算や定義を勉強したけど、イメージがよくわかない」
こんな悩みや疑問がある方はご参考ください( ˘ω˘)
動画で心理統計を学びませんか?
クリタマ勉強部屋では、修士論文に苦しんでいる心理系大学院生向けに、統計法の学習動画を提供しています(^^♪
今ならM-GTA記事も特典でついてきます
統計法の理解は長いことかかりますので、M1・M2の皆様は、ライフワークバランスを保つ選択肢の1つとしてぜひご活用ください。
結論~偏相関係数とは~
まずは結論ファーストでいきましょう。
偏相関係数とは、2つの変数から他の変数の影響を除いた時の相関のことです。
「このように、2つの変数から他の変数の影響を除いた相関関係を、偏相関係数と呼ぶ」 (引用:多変量データ解析法、P49. 中段、8-9行目)
これは言い換えると、「誤差同士の相関」とも言えます。
例えば、↓こちらのデータで考えてみます。

そして、 以下は標準解と非標準解の違いで得られたデータのパス図(標準解)のイメージです。

そして、この図の赤枠で囲まれた部分が「誤差」です。
そして、「誤差」とは、簡単に言うと「重回帰式では説明しきれない部分」のことです。
※詳しくは、誤差と分散の違いを参照してください。
今回のモデルでは、「広告費」と「人員数」から「売上」を予測しているため、誤差は「広告費と人員数からは説明できない要因」を示しているわけです。
そして、「偏相関係数=2つの変数から他の変数の影響を除いたときの相関係数」でした。
つまり、上記モデルの「誤差」は、「広告費と人員数の影響を除いた売上独自の成分」のことを言います。
すると、次にわからないのが「2つの変数から他の変数の影響を除いたときの相関係数」という表現の「2つの」という部分です。
ここまでは、広告費と人員数から「売上」を予測することを考えましたが、今度は広告人人員数から「面積」を予測することを考えてみます。
すると、パス図は↓このようになります。

すると、ここでも「広告費と人員数から説明しきれない部分(誤差)」が出てきます。
これが、「2つの変数のうちの1つ」ということです
- 誤差①:売上を予測する上で、広告費と人員数では説明しきれない部分
- 誤差②:事業所面積を予測する上で、広告費と人員数では説明しきれない部分
つまり、この「誤差①」と「誤差②」の相関関係こそが、偏相関係数となります。
「以上の偏相関係数は、パス図を用いれば、図5.2の対応(A)の誤差と、(B)の誤差との相関係数に等しいといえる。すなわち、値段とデザインでは説明されずに残る素材独自の成分、および売れ行き独自の成分の相関係数が、(5.12)の偏相関係数である」
(引用:多変量データ解析法、P49、最終段落、1-3行目)
相関係数と偏相関係数の違い
なぜわざわざ「偏相関係数」を用いるのでしょうか。
それは、第三の変数の影響を取り除くことに意義があるからです。
つまり、偏相関係数を使うことで「売上」と「面積」のより直接的な関係性を擦数値として把握することができます。
一方、相関係数の場合は、他の変数の影響を取り除いていないため、直接的な関係が見えづらいのです!
その結果、通常の相関係数では「負の値」であっても、偏相関係数で見ると「正の値」に変わる、といった現象が起こるので注意が必要になります。
「素材と売れ行きの(通常の)相関関係は-0.27と負の値であったが(表5.1)、上記のように、偏相関係数は0.58となり、値段とデザインの影響を除けば、素材と売れ行きには正の相関関係があることがわかる」
(引用:多変量データ解析法、P49.〈5.4 偏相関係数〉3段落1-3行目)
まとめ
いかがでしたでしょうか? 偏相関係数について少しは理解が深まったでしょうか?
最後に本記事の内容を振り返っておわかれです(^^)/
- 偏相関係数とは、特定の変数の影響を除いた「誤差同士」の相関のこと
- 偏相関係数は、他の要因を排除して「直接的な関係」を見たい場合に必要
ということなんですね~ それではまた(^^ゞ
偏相関係数についてさらに詳しく理解したい方は↓こちら
参考
こちらの記事を作成にする上での参考文献です(^ω^)
①多変量解析がわかる
②多変量データ解析法
③例題とExcel演習で学ぶ多変量解析



コメント