일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- R
- 회귀분석
- 파이썬 완벽 가이드
- 스파르타
- MySQL
- 파이썬 머신러닝 완벽가이드
- 파이썬 철저입문
- 실전 데이터 분석 프로젝트
- 스파르타 코딩
- 내일배움캠프
- 텍스트 분석
- wil
- 프로젝트
- 내일배움카드
- 프로그래머스
- TiL
- hackerrank
- 파이썬
- 파이썬 철저 입문
- 파이썬 머신러닝 완벽 가이드
- 티스토리챌린지
- 오블완
- 스파르타코딩
- 웹 스크랩핑
- 미세먼지
- harkerrank
- SQL
- 중회귀모형
- Cluster
- 내일배움
- Today
- Total
OkBublewrap
[통계 101 x 데이터 분석] 모집단과 표본 본문
데이터 분석의 목적
구체적인 데이터 분석 목적을 정하는 것이 중요한 첫단계
데이터 분석의 목적에 따라 어떤 실험이나 관측으로 데이터를 얻어야 할지, 어떻게 데이터를 분석해야 할지 달라진다.
사례
- 신약의 효과 유무와 효과의 크기를 알고 싶다.
- 기온으로부터 올해 농작물 수확량을 예측하고 싶다.
알고자 하는 대상
분석의 목적을 정했다면 알고자 하는 대상을 명확히 하는 것이 중요
위 사례중 신약의 효과 유무와 효과 크기를 알기 위해서 알고자 하는 대상은 고혈압이 있는 모든 사람이다.
여기서 중요한 단어는 '모두'이다. 실험에 참가하지 않는 고혈합이 있는 모든 사람이 해당되기 때문이다.
모집단
모집단 : 통계학에서 알고자 하는 대상 전체
데이터를 분석할 때, 데이터 분석 목적과 알고자 하는 대상에 기초하여 직접 모집단을 설정해야 한다.
알고자 하는 대상이 전체일지라도, 실제로 데이터를 얻을 가능성이 없는 요소를 포함한 모집단은 적절하지 않다.
Ex) 모든 고혈압 환자 대상으로 진행하고 싶음
But 모종의 이유로 여성 환자 데이터를 얻을 수 없음
Then 고혈압 남성 환자를 모집단을 설정하는 것이 적절하다.
지금 알고자 하는 대상은 무엇인지 그리고 무엇을 모집단으로 설정할 것인지의
문제에는 항상 주의를 기울여야 한다.
모집단의 크기
모집단 크기 : 모집단에 포함된 요소의 수 $ N $
- 유한 모집단 : 모집단 중 한정된 요소만 포함 한것
- 무한 모집단 : 모집단 중 포함된 요소의 개수가 무한한 것
모집단의 성질
모집단의 성질을 알 수 있다면 대상을 설명하거나 이해할 수 있고, 미지의 데이터를 예측할 수도 있게 된다.
전수조사
모집단에 포함된 모든 요소를 조사하는 방법
획득한 데이터의 특징한 파악하고 기술하기만 해도, 모집단의 성질을 설명하고 이해할 수 있다.
전수조사 어려움
전수조사를 실시하려면 비용이나 시간 면에서 부담이 막대하여 실현 불가능할 때가 대부분이다.
표본조사
모집단의 일부를 분석하여 모집단 전체의 성질을 추정하는 추론통계
표본 : 모집단 일부분
표본추출 : 표본을 뽑는 것
알아 둘 내용
대상을 설명하고 예측하기 위해서는 모집단의 성질을 알아야한다
모집단 대상으로 한 전수조사는 어렵다
표본을 조사하면 모집단의 성질을 추정할 수 있다
표본 크기 : 표본에 포함된 요소의 개수 $ n $
표본의 개수 : sample 수
표본크기는 모집단의 성질을 추정할 때의 확실성이나 가설검정의 결과에도 영향을 끼치기 때문에, 통계분석에 있어 중요한 요소 중 하나다.
'Statistics' 카테고리의 다른 글
[통계 101 x 데이터 분석] 추론통계 ~ 신뢰구간 (0) | 2025.01.21 |
---|---|
[통계 101 x 데이터 분석] 통계분석의 기초 (0) | 2025.01.20 |
[통계 101 x 데이터 분석] 통계학이란? (0) | 2025.01.20 |
연구의 종류 (0) | 2025.01.16 |
표준화 중회귀 (0) | 2021.06.09 |