重回帰モデルとは?

統計法

クリタマです(^ω^)

今回のテーマは、「重回帰モデル」です。

重回帰モデルとは

重回帰モデルとは、以下の式すなわち、「重回帰式」と「誤差式」を1つにまとめた式のことを言います。そして、重回帰モデルは一般的に「パス図」を使って視覚的に表されます。

  • ①予測値=(独立変数①×a)+(独立変数②×b)+ 切片
  • ②誤差=従属変数-予測値

では、1つにまとめるとはどういうことか?

まず、この2つの式に共通部分にお気づきのことかと思います。そう「予測値」の部分です。そこで、②の式に注目し、これを次の様に変換してみます。

  • ③従属変数=予測値+誤差

そこで、①の式をこの③の式に代入すれば、1つにまとまるというわけです。

  • ④従属変数=(独立変数×a)+(独立変数②×b)+ 切片+誤差

この式こそ、「重回帰モデル」だといえます

パス図

で、冒頭に申し上げた通り、重回帰モデルは一般的に「パス図」を使って視覚的に表されます。パス図では、観測される変数は四角で、誤差を円で描きます。こんな感じですね。

加えて、パス図の独立変数から従属変数に向かって伸びる矢印上に「a」と「b」とありますが、これは「偏回帰係数」を示し、これらが独立変数(食事量・運動量)に乗じられ、そこに切片を加えらた値が、「従属変数(体重)」になることを意味します。ただし、切片は基本パス図では省かれます。

重回帰モデルの「式とパス図」の関係

では、最後に、この図を先ほどの「④の式」と照らし合わせて見ましょう。「④の式」とは以下の式です。

  • 従属変数=(独立変数×a)+(独立変数②×b)+ 切片+誤差

で、図はこちらですね。

対応部分は以下の通りです。

  • 赤枠の部分→(独立変数×a)+(独立変数②×b)+ 切片
  • 青枠の部分→誤差

そして、これらを足したものが、「従属変数」つまり、「体重」になるということを意味するわけですね。

それと、最後に「誤差」に関する注意点です。

重回帰モデルでは、いわば「結果」である従属変数を、その「原因(要因)」とみなせる説明変数で説明しようとするモデルである。そして、「説明変数では説明されずに残った要因」として、誤差が導入され、そこから従属変数にパスが伸びるわけである。

(引用:足立浩平(2006),多変量データ解析法,ナカニシヤ出版)

これは、つまり体重が「運動量」と「食事量」だけでは、説明しきれないということで、例えば、本人の体調や、天候、気温などにもおそらく左右されるものであることを意味してます。

なので、足立氏は以下の様な提案をしてますね。覚えておきましょう。

すなわち、誤差を、文字通りの「誤った差」と見なすのではなく、

誤差=「説明変数では説明しきれずに残った成分」

のように考えるべきである。

(引用:足立浩平(2006),多変量データ解析法,ナカニシヤ出版)

参考書

コメント

タイトルとURLをコピーしました