OkBublewrap

표준화 중회귀 본문

Statistics

표준화 중회귀

옥뽁뽁 2021. 6. 9. 15:59

표준화 중회귀모형

(standardized multiple regression)

 

$$ b_{\underline{B}}의\ 크기는\ X_{\underline{B}}의\ 측정단위를\ 반영하기\ 때문에\
회귀계수를 \ 직접\ 비교하는\ 것은\ 문제가\ 있다  $$

=> 표준화 변수를 사용한 표준화 중회귀모형으로 이러한 문제해결 

 

(표준화 회귀모형)

$$ y_{i}^{*}=\beta _{1}^{*}x_{1i}+\beta _{2i}^{*}x_{i}+\cdots +\beta _{p}^{*}x_{pi}+\varepsilon_{i} $$

 

$$ y_{i}^{*}=\frac{1}{\sqrt{n-1}}(\frac{y_{i}-\bar{y}}{S_{y}}), \bar{y}=\frac{1}{n}\sum y_{i}, S_{y}=\sqrt{\frac{\sum (y_{i}-\bar{y})^2}{n-1}} $$

 

$$ x_{i}^{*}=\frac{1}{\sqrt{n-1}}(\frac{x_{1i}-\bar{x}_{1}}{S_{x_{1}}}), \bar{x}_{1}=\frac{1}{n}\sum x_{1i}, S_{x_{1}}=\sqrt{\frac{\sum (x_{1i}-\bar{x_{1}})^2}{n-1}} $$


$$ x_{p}^{*}=\frac{1}{\sqrt{n-1}}(\frac{x_{pi}-\bar{x}_{p}}{S_{x_{p}}}), \bar{x}_{p}=\frac{1}{n}\sum x_{pi}, S_{x_{p}}=\sqrt{\frac{\sum (x_{pi}-\bar{x_{p}})^2}{n-1}} $$

 

(표준화 회귀계수)

$$ \underline{b}^*=(X^{*'}X)^-1(X^{*'}\underline{y}^{*}) $$

 

 


질적변수

 

양적 변수 : 길이, 무게, 온도, 압력, 수입 

질적 변수 : 성별, 학력. 방법 

 

Ex) 한 개의 질적 변수

관측 반응시간(y) 나이(x1) 성별(x2)
1 y1 x11
2 y2 x12
3 y3 x13
4 y4 x14
5 y5 x15
6 y6 x16
7 y7 x17
8 y8 x18
9 y9 x19
10 y10 x110

1) 모형

$$ y = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + \epsilon $$

$$ x_{2} = \left\{\begin{matrix}
1,M & \\ 2,F & 
\end{matrix}\right. $$ 

이렇게 정의된 변수를 지시변수, 가변수라고 한다.

※ (범주의 수 -1) 개의 가변수가 필요하다.

 

남자 $$ E(y) = (\beta_{0}+\beta_{2})+\beta_{1}x_{1} $$
여자  $$ E(y) = \beta_{0}+\beta_{1}x_{1} $$

 

남자와 여자의 회귀식의 기울기는 동일하고 높이는 다를 수 있다고 가정

$$ H_{0} : \beta_{2} = 0 으로 검정 $$