重回帰分析について:
単回帰分析と違い独立変数が複数ある。また、当てはまりの良い直線ではなく最も当てはまりの良いモデルを探すことが目的。
決定係数、自由度修正済み決定係数、P値から独立変数が従属変数に与える影響が低いと判断できた場合、分析に必要のない独立変数データは削除する。
(例:データAの単回帰分析と重回帰分析を比較した。後者のR²値は下がり説明力も
下がった。また、独立変数BのP値は異常に高く従属変数に影響を与えている可能
性が低いので削除した)
前回の不動産データに独立変数yearを追加して重回帰分析を行った結果↓
Dep. Variable: | price | R-squared: | 0.776 |
---|---|---|---|
Model: | OLS | Adj. R-squared: | 0.772 |
Method: | Least Squares | F-statistic: | 168.5 |
Date: | Fri, 10 Dec 2021 | Prob (F-statistic): | 2.77e-32 |
Time: | 06:31:19 | Log-Likelihood: | -1191.7 |
No. Observations: | 100 | AIC: | 2389. |
Df Residuals: | 97 | BIC: | 2397. |
Df Model: | 2 | ||
Covariance Type: | nonrobust |
coef | std err | t | P>|t| | [0.025 | 0.975] | |
---|---|---|---|---|---|---|
const | -5.772e+06 | 1.58e+06 | -3.647 | 0.000 | -8.91e+06 | -2.63e+06 |
size | 227.7009 | 12.474 | 18.254 | 0.000 | 202.943 | 252.458 |
year | 2916.7853 | 785.896 | 3.711 | 0.000 | 1357.000 | 4476.571 |
Omnibus: | 10.083 | Durbin-Watson: | 2.250 |
---|---|---|---|
Prob(Omnibus): | 0.006 | Jarque-Bera (JB): | 3.678 |
Skew: | 0.095 | Prob(JB): | 0.159 |
Kurtosis: | 2.080 | Cond. No. | 9.41e+05 |
決定係数はどちらも約+0.03上がっており、ばらつきへの説明力は上昇。
独立変数yearのP値は低く、従属変数に与える影響は高い。
結論、価格と築年数には関係性があるといえる。