일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 내일배움카드
- 프로젝트
- 오블완
- 스파르타
- R
- 파이썬
- 파이썬 머신러닝 완벽가이드
- 텍스트 분석
- 미세먼지
- 파이썬 완벽 가이드
- 티스토리챌린지
- harkerrank
- 파이썬 철저입문
- 내일배움캠프
- 중회귀모형
- 내일배움
- SQL
- 파이썬 머신러닝 완벽 가이드
- TiL
- 파이썬 철저 입문
- 실전 데이터 분석 프로젝트
- 프로그래머스
- Cluster
- 웹 스크랩핑
- 스파르타 코딩
- wil
- hackerrank
- 회귀분석
- MySQL
- 스파르타코딩
- Today
- Total
OkBublewrap
표준화 중회귀 본문
표준화 중회귀모형
(standardized multiple regression)
$$ b_{\underline{B}}의\ 크기는\ X_{\underline{B}}의\ 측정단위를\ 반영하기\ 때문에\
회귀계수를 \ 직접\ 비교하는\ 것은\ 문제가\ 있다 $$
=> 표준화 변수를 사용한 표준화 중회귀모형으로 이러한 문제해결
(표준화 회귀모형)
$$ y_{i}^{*}=\beta _{1}^{*}x_{1i}+\beta _{2i}^{*}x_{i}+\cdots +\beta _{p}^{*}x_{pi}+\varepsilon_{i} $$
$$ y_{i}^{*}=\frac{1}{\sqrt{n-1}}(\frac{y_{i}-\bar{y}}{S_{y}}), \bar{y}=\frac{1}{n}\sum y_{i}, S_{y}=\sqrt{\frac{\sum (y_{i}-\bar{y})^2}{n-1}} $$
$$ x_{i}^{*}=\frac{1}{\sqrt{n-1}}(\frac{x_{1i}-\bar{x}_{1}}{S_{x_{1}}}), \bar{x}_{1}=\frac{1}{n}\sum x_{1i}, S_{x_{1}}=\sqrt{\frac{\sum (x_{1i}-\bar{x_{1}})^2}{n-1}} $$
$$ x_{p}^{*}=\frac{1}{\sqrt{n-1}}(\frac{x_{pi}-\bar{x}_{p}}{S_{x_{p}}}), \bar{x}_{p}=\frac{1}{n}\sum x_{pi}, S_{x_{p}}=\sqrt{\frac{\sum (x_{pi}-\bar{x_{p}})^2}{n-1}} $$
(표준화 회귀계수)
$$ \underline{b}^*=(X^{*'}X)^-1(X^{*'}\underline{y}^{*}) $$
질적변수
양적 변수 : 길이, 무게, 온도, 압력, 수입
질적 변수 : 성별, 학력. 방법
Ex) 한 개의 질적 변수
관측 | 반응시간(y) | 나이(x1) | 성별(x2) |
1 | y1 | x11 | 남 |
2 | y2 | x12 | 남 |
3 | y3 | x13 | 남 |
4 | y4 | x14 | 남 |
5 | y5 | x15 | 남 |
6 | y6 | x16 | 여 |
7 | y7 | x17 | 여 |
8 | y8 | x18 | 여 |
9 | y9 | x19 | 여 |
10 | y10 | x110 | 여 |
1) 모형
$$ y = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + \epsilon $$
$$ x_{2} = \left\{\begin{matrix}
1,M & \\ 2,F &
\end{matrix}\right. $$
이렇게 정의된 변수를 지시변수, 가변수라고 한다.
※ (범주의 수 -1) 개의 가변수가 필요하다.
남자 | $$ E(y) = (\beta_{0}+\beta_{2})+\beta_{1}x_{1} $$ |
여자 | $$ E(y) = \beta_{0}+\beta_{1}x_{1} $$ |
남자와 여자의 회귀식의 기울기는 동일하고 높이는 다를 수 있다고 가정
$$ H_{0} : \beta_{2} = 0 으로 검정 $$
'Statistics' 카테고리의 다른 글
[통계 101 x 데이터 분석] 추론통계 ~ 신뢰구간 (0) | 2025.01.21 |
---|---|
[통계 101 x 데이터 분석] 통계분석의 기초 (0) | 2025.01.20 |
[통계 101 x 데이터 분석] 모집단과 표본 (0) | 2025.01.20 |
[통계 101 x 데이터 분석] 통계학이란? (0) | 2025.01.20 |
연구의 종류 (0) | 2025.01.16 |