この記事は、心理系大学院生を対象とした統計法の学習ページです。
- 重回帰分析の独自成分ってなに?
- 教科書を読んだけど、結局どういう意味かよくわからない…
統計法の学習を進める中で、このような悩みや疑問をお持ちの心理系大学院生の方は多いのではないでしょうか。
一見難しそうに見えますが、イメージを掴めばスッキリ理解できる概念です。
ぜひ本記事を参考にしてみてください( ˘ω˘)
動画で心理統計を学びませんか?
クリタマ勉強部屋では、修士論文に苦しんでいる心理系大学院生向けに、統計法の学習動画を提供しています(^^♪
今ならM-GTA記事も特典でついてきます
統計法の理解は長いことかかりますので、M1・M2の皆様は、ライフワークバランスを保つ選択肢の1つとしてぜひご活用ください。
結論~独自成分とは~
独自成分とは、一言で言うと誤差のことです。
細かく言うと、「他の変数の影響を除外した場合の、当該説明変数の影響」を指します。
結論を先に述べると、前半の独自成分とは以下のように定義されます。
「当該説明変数を他の説明変数から予測する重回帰分析の誤差の値に相当する」
(引用:多変量データ解析法,P.47 【5.3 他の説明変数の影響の除去と誤差】5-6行目)
例えば、以下のようなデータを想定してみましょう。

このデータには次のような設定があります。
- 独立変数①:広告費
- 独立変数②:従業員数
- 独立変数③:面積
- 従属変数:売上
このような前提において、「広告費」の独自成分について考えてみます。
広告費の独自成分とは、「従業員数(変数②)」と「面積(変数③)」の影響を除外した、広告費特有の成分を意味します。
これをパス図で示すと以下のようになります。

つまり、「赤点線で囲った誤差 = 広告費の独自成分」ということです。
これは「従業員数でも面積でも説明できない、広告費だけの成分」ということです。
独自成分を数式で考える
独自成分について数式で考えてみましょう。
例えば、先ほどのデータから重回帰分析を行うと、以下のような重回帰式が得られます。
- y=ax+bz+c
これは予測式なので、特定の事業所の「従業員数」と「面積」の値を代入すれば、広告費の予測値が得られます。
仮に、この式から、予測値として「450」という値が得られたとします。
しかし、実測値(実際のデータ)を見ると「500」だった場合、そこには「50」のズレが生じますよね?
この「50」という値こそが、「従業員数と面積では説明しきれない、広告費特有の成分(独自成分)」です。
つまり、これが「誤差」の正体です。
厳密に言うと「残差」なのですが、誤差は残差の集合のようなものなので、まずはそのようなイメージで理解しておきましょう。
残差と誤差の違いは↓↓こちら
独自成分の記述方法
こうした独自成分は、次のように記号で表されます。
- 「広 | 人・面」
これは、「広告費(広)から、従業員数(人)と面積(面)の影響を除いた成分」という意味です。
「こうした独自成分、つまり誤差の値を『当該変数 | 他の説明変数』のように、その影響が除かれる変数を、縦線(|)の後に書いた記号で表す。従って、値段の独自成分は『値 | 素・デ』と表せる」
(引用:多変量データ解析法,P.48 9-13行目)
他の変数の独自成分についても整理する
では、以上を踏まえて、独立変数②(従業員数)と③(面積)の独自成分についても整理してみましょう(^^ゞ
1. 従業員数の独自成分
「従業員数」の独自成分を求める場合、広告費と面積から従業員数を予測する重回帰分析を行います。
パス図にすると以下のようになります。

先ほどと同様に、「赤枠 = 誤差」が「従業員数の独自成分」となります。
これを記述すると
- 「人 | 広・面」
となるわけです。
2. 面積の独自成分
「面積」も同じ要領で、以下のように表すことができます。

記述すると
- 「面 | 広・人」
となります。
これは、「人員数と広告費では説明しきれない、面積独自に売上に影響する成分」を意味しています。
まとめ
いかがでしたでしょうか? 重回帰分析における「独自成分」について、少しは理解が深まったでしょうか?
最後に本記事の内容を振り返ってお別れです(^^)/
- 独自成分とは、他の説明変数の影響を除いた「誤差(残差)」のこと
- 独自成分は、その変数特有の影響力を純粋に評価したい時におすすめ
ということなんですね~。 数式や記号で見ると難解ですが、構造を分解すれば意外とシンプルです。
それではまた(^^ゞ
参考
こちらの記事を作成にする上での参考文献です(^ω^)
①多変量解析がわかる
②多変量データ解析法
③例題とExcel演習で学ぶ多変量解析




コメント