偏相関係数とは?わかりやすく

心理統計法

この記事は、心理系大学院生を対象とした統計法の学習ページです。

  • 「偏相関係数って結局なんなの?」
  • 「計算や定義を勉強したけど、イメージがよくわかない」

こんな悩みや疑問がある方はご参考ください( ˘ω˘)

動画で心理統計を学びませんか?

クリタマ勉強部屋では、修士論文に苦しんでいる心理系大学院生向けに、統計法の学習動画を提供しています(^^♪

今ならM-GTA記事も特典でついてきます

統計法の理解は長いことかかりますので、M1・M2の皆様は、ライフワークバランスを保つ選択肢の1つとしてぜひご活用ください。

結論~偏相関係数とは~

まずは結論ファーストでいきましょう。

偏相関係数とは、2つの変数から他の変数の影響を除いた時の相関のことです。

「このように、2つの変数から他の変数の影響を除いた相関関係を、偏相関係数と呼ぶ」 (引用:多変量データ解析法、P49. 中段、8-9行目)

これは言い換えると、「誤差同士の相関」とも言えます。

例えば、↓こちらのデータで考えてみます。

そして、 以下は標準解と非標準解の違いで得られたデータのパス図(標準解)のイメージです。

そして、この図の赤枠で囲まれた部分が「誤差」です。

そして、「誤差」とは、簡単に言うと「重回帰式では説明しきれない部分」のことです。

※詳しくは、誤差と分散の違いを参照してください。

今回のモデルでは、「広告費」と「人員数」から「売上」を予測しているため、誤差は「広告費と人員数からは説明できない要因」を示しているわけです。

そして、「偏相関係数=2つの変数から他の変数の影響を除いたときの相関係数」でした。

つまり、上記モデルの「誤差」は、「広告費と人員数の影響を除いた売上独自の成分」のことを言います。

すると、次にわからないのが2つの変数から他の変数の影響を除いたときの相関係数」という表現の「2つの」という部分です。

ここまでは、広告費と人員数から「売上」を予測することを考えましたが、今度は広告人人員数から「面積」を予測することを考えてみます。

すると、パス図は↓このようになります。

すると、ここでも「広告費と人員数から説明しきれない部分(誤差)」が出てきます。

これが、「2つの変数のうちの1つ」ということです

  • 誤差①:売上を予測する上で、広告費と人員数では説明しきれない部分
  • 誤差②:事業所面積を予測する上で、広告費と人員数では説明しきれない部分

つまり、この「誤差①」と「誤差②」の相関関係こそが、偏相関係数となります。

「以上の偏相関係数は、パス図を用いれば、図5.2の対応(A)の誤差と、(B)の誤差との相関係数に等しいといえる。すなわち、値段とデザインでは説明されずに残る素材独自の成分、および売れ行き独自の成分の相関係数が、(5.12)の偏相関係数である」

(引用:多変量データ解析法、P49、最終段落、1-3行

相関係数と偏相関係数の違い

なぜわざわざ「偏相関係数」を用いるのでしょうか。

それは、第三の変数の影響を取り除くことに意義があるからです。

つまり、偏相関係数を使うことで「売上」と「面積」のより直接的な関係性を擦数値として把握することができます。

一方、相関係数の場合は、他の変数の影響を取り除いていないため、直接的な関係が見えづらいのです!

その結果、通常の相関係数では「負の値」であっても、偏相関係数で見ると「正の値」に変わる、といった現象が起こるので注意が必要になります。

「素材と売れ行きの(通常の)相関関係は-0.27と負の値であったが(表5.1)、上記のように、偏相関係数は0.58となり、値段とデザインの影響を除けば、素材と売れ行きには正の相関関係があることがわかる」

(引用:多変量データ解析法、P49.〈5.4 偏相関係数〉3段落1-3行目)

まとめ

いかがでしたでしょうか? 偏相関係数について少しは理解が深まったでしょうか?

最後に本記事の内容を振り返っておわかれです(^^)/

  • 偏相関係数とは、特定の変数の影響を除いた「誤差同士」の相関のこと
  • 偏相関係数は、他の要因を排除して「直接的な関係」を見たい場合に必要

ということなんですね~ それではまた(^^ゞ

偏相関係数についてさらに詳しく理解したい方は↓こちら

参考

こちらの記事を作成にする上での参考文献です(^ω^)

①多変量解析がわかる

②多変量データ解析法

③例題とExcel演習で学ぶ多変量解析

コメント

タイトルとURLをコピーしました