2026-01-23
\[ y = \beta_0 + \beta_1 x + u \]
\[ E(u|x) = 0 \]
\[ E(y|x) = \beta_0 + \beta_1 x \]
\[ \hat{u}_i = y_i - \hat{\beta}_0 - \hat{\beta}_1 x_i \]
\[ \min_{\hat{\beta}_0, \hat{\beta}_1} \sum_{i=1}^n (y_i - \hat{\beta}_0 - \hat{\beta}_1 x_i)^2 \]
\[ \hat{\beta}_1 = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^n (x_i - \bar{x})^2} = \frac{\text{Cov}(x, y)}{\text{Var}(x)} \]
\[ \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} \]
ceosal1)ceosal1
データセットを使用して、CEOの給与(salary)と企業の自己資本利益率(roe)の関係を分析する。\[ salary = \beta_0 + \beta_1 roe + u \]
## salary roe
## 1 1095 14.1
## 2 1001 10.9
## 3 1122 23.5
## 4 578 5.9
## 5 1368 13.8
## 6 1145 20.0
lm関数)lm() 関数(Linear
Model)を使用して回帰分析を行う。##
## Call:
## lm(formula = salary ~ roe, data = ceosal1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1160.2 -526.0 -254.0 138.8 13499.9
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 963.19 213.24 4.517 1.05e-05 ***
## roe 18.50 11.12 1.663 0.0978 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1367 on 207 degrees of freedom
## Multiple R-squared: 0.01319, Adjusted R-squared: 0.008421
## F-statistic: 2.767 on 1 and 207 DF, p-value: 0.09777
\[ \widehat{salary} = 963.19 + 18.50 \cdot roe \]
plot(ceosal1$roe, ceosal1$salary,
xlab = "Return on Equity (roe)",
ylab = "CEO Salary (salary)",
main = "CEO Salary vs ROE")
abline(model_ceo, col = "blue", lwd = 2)\[ R^2 = \frac{\text{SSE}}{\text{SST}} = 1 - \frac{\text{SSR}}{\text{SST}} \]
SSE (Explained Sum of Squares): 回帰変動
SSR (Residual Sum of Squares): 残差変動
SST (Total Sum of Squares): 全変動
\(0 \le R^2 \le 1\) であり、1に近いほどモデルの当てはまりが良いとされるが、低いからといってモデルが無意味なわけではない。
ceosal1 の \(R^2\)summary(model_ceo))を見ると、Multiple R-squared: 0.01319
となっている。roe
で説明できていないことを意味する。roe
以外の多くの要因が影響していることが示唆される。| モデル | 方程式 | 解釈 |
|---|---|---|
| Level-level | \(y = \beta_0 + \beta_1 x\) | \(\Delta y = \beta_1 \Delta x\) |
| Log-level | \(\log(y) = \beta_0 + \beta_1 x\) | \(\% \Delta y \approx (100 \beta_1) \Delta x\) |
| Level-log | \(y = \beta_0 + \beta_1 \log(x)\) | \(\Delta y \approx (\beta_1 / 100) \% \Delta x\) |
| Log-log | \(\log(y) = \beta_0 + \beta_1 \log(x)\) | \(\% \Delta y \approx \beta_1 \% \Delta x\) (弾力性) |
wage1)wage)の対数をとり、教育年数(educ)で回帰する(Log-levelモデル)。\[ \log(wage) = \beta_0 + \beta_1 educ + u \]
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.58377267 0.097335834 5.99751 3.736702e-09
## educ 0.08274437 0.007566694 10.93534 3.270645e-25
\[ \widehat{\log(wage)} = 0.584 + 0.083 \cdot educ \]