エンジニアの備忘録

学んだ事をアウトプットしていきます

pythonで重回帰分析

重回帰分析について:

単回帰分析と違い独立変数が複数ある。また、当てはまりの良い直線ではなく最も当てはまりの良いモデルを探すことが目的。

決定係数、自由度修正済み決定係数、P値から独立変数が従属変数に与える影響が低いと判断できた場合、分析に必要のない独立変数データは削除する。

(例:データAの単回帰分析と重回帰分析を比較した。後者のR²値は下がり説明力も

   下がった。また、独立変数BのP値は異常に高く従属変数に影響を与えている可能 

   性が低いので削除した)  

 

前回の不動産データに独立変数yearを追加して重回帰分析を行った結果↓

OLS Regression Results
Dep. Variable: price R-squared: 0.776
Model: OLS Adj. R-squared: 0.772
Method: Least Squares F-statistic: 168.5
Date: Fri, 10 Dec 2021 Prob (F-statistic): 2.77e-32
Time: 06:31:19 Log-Likelihood: -1191.7
No. Observations: 100 AIC: 2389.
Df Residuals: 97 BIC: 2397.
Df Model: 2    
Covariance Type: nonrobust    
  coef std err t P>|t| [0.025 0.975]
const -5.772e+06 1.58e+06 -3.647 0.000 -8.91e+06 -2.63e+06
size 227.7009 12.474 18.254 0.000 202.943 252.458
year 2916.7853 785.896 3.711 0.000 1357.000 4476.571
Omnibus: 10.083 Durbin-Watson: 2.250
Prob(Omnibus): 0.006 Jarque-Bera (JB): 3.678
Skew: 0.095 Prob(JB): 0.159
Kurtosis: 2.080 Cond. No. 9.41e+05

決定係数はどちらも約+0.03上がっており、ばらつきへの説明力は上昇。

独立変数yearのP値は低く、従属変数に与える影響は高い。

結論、価格と築年数には関係性があるといえる。