Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 회귀분석
- 스파르타코딩
- 스파르타
- 웹 스크랩핑
- 내일배움카드
- Cluster
- 파이썬 머신러닝 완벽가이드
- 프로젝트
- 티스토리챌린지
- R
- 미세먼지
- 파이썬 철저 입문
- hackerrank
- 프로그래머스
- 어쩌다 마케팅
- 중회귀모형
- TiL
- MySQL
- harkerrank
- 파이썬 머신러닝 완벽 가이드
- 텍스트 분석
- wil
- 실전 데이터 분석 프로젝트
- 파이썬
- 내일배움캠프
- 파이썬 철저입문
- 내일배움
- 오블완
- 스파르타 코딩
- SQL
Archives
- Today
- Total
OkBublewrap
연구의 종류 본문
인위적인 개입 유무에 따른 실험연구(왼) 관찰연구(오)으로 나눔
관찰 연구
- 정의 : 연구자 혹은 분석가가 직접적으로 개입하지 않고 자연스럽게 발생하는 데이터를 관찰하여 분석하는 연구 설계
- 예시
- 흡연자와 건강 상태를 비교하는 연구
- 웹사이트에서 사용자들이 자발적으로 클릭한 광고의 효과를 분석
- 특징
- 이미 주어진 데이터로 기술통계를 내거나 확인하는 연구
- 이미 있는 데이터를 후향적으로 연구함
- 관찰연구의 한계 : 이미 획득한 데이터이기 때문에 우리가 관심있는 변수를 변경해서 측정할 수 없다.
- 종속변수와 독립변수 둘 다 영향을 줄 수 있는 변수를 교란변수가 존재
- 교란 변수 : 독립변수와 종속변수에 둘 다 영향을 주어 인과 관계 해석을 방해하는 변수
- 1. 인과 추론(통계적 조정)
- 2. RCT(실험 설계)
교란 변수 극복
인과 추론
- 말 그대로 X-Y의 인과관계를 밝혀내는 방법
- 관찰된 데이터를 가지고 교란변수를 통제하는 방법론(매칭, 차분법) 등이 필수적임
- 예시
- 서비스에서 유료마케팅을 진행하니 자연유입이 줄고 유료마케팅 진입이 늘었다. 이때, 유료 마케팅의 유입효과를 어떻게 정량화 할 수 있을까? 원래 자연 유입으로 들어오려했던 유저가 아니였을까?
실험 연구
- 정의 : 연구가 실험 대상을 처치에 따라 두 그룹으로 배정하여 결과를 비교하는 연구
- 실험연구가 중요한 이유는 모든 변수를 통제하고 우리가 원하는 개입에 따른 영향을 분석할 수 있기 때문
- 예시
- 임상시험에서 고혈압 약제를 투여한 그룹과 플라시보를 투여한 그룹 간의 혈압 개선 연구
- 웹사이트 A/B 테스트에서 두 가지 페이지를 무작위로 보여주고 클릭율을 비교하는 연구
- 특징
- 나머지 모든 변수를 통제하고 독립변수로 인한 결과에 관심
- 데이터를 전향적하게 수집하여 연구함
용어
- 처리(Treatment): 어떤 대상에 주어지는 환경이나 조건 (약, 가격, 이벤트)
- 처리군(Treatment Group): 특정 처리에 노출된 대상들의 집단
- 대조군(Control Group): 어떤 처리도 하지 않은 대상들의 집단
- 임의화(Randomization): 처치를 적용할 대상을 임의로 결정하는 과정
- 대상(subject): 처리를 적용할 개체 대상
무작위 대조실험
관찰연구 무작위 대조 실험(RCT)
관찰연구 | 무작위 대조 실험(RCT) | |
개입 여부 | 연구자가 직접 개입하지 않고 자연스러운 데이터 관찰 |
대조군과 실험군을 무작위로 할당 실험군에 개입 |
인과 관계 규명 | 어려움 | 가능 |
교란 변수 통제 | 교란변수 어려움, PSM 등을 통한 제어 방법 고민 | 무작위할당으로 교란변수를 통제 가능 |
윤리문제 | 거의 없음 | 발생할 수 있음 (Ex 신약 개발) |
실행 비용 | 비용이 적고 시간이 덜 소요 | 시간과 비용이 많이 듬 |
적용 예시 | 흡연이 건강에 미치는 영향 | 임상시험, 온라인 통제실험 |
'Statistics' 카테고리의 다른 글
[통계 101 x 데이터 분석] 추론통계 ~ 신뢰구간 (0) | 2025.01.21 |
---|---|
[통계 101 x 데이터 분석] 통계분석의 기초 (0) | 2025.01.20 |
[통계 101 x 데이터 분석] 모집단과 표본 (0) | 2025.01.20 |
[통계 101 x 데이터 분석] 통계학이란? (0) | 2025.01.20 |
표준화 중회귀 (0) | 2021.06.09 |