일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- MySQL
- 내일배움캠프
- 스파르타
- 실전 데이터 분석 프로젝트
- 내일배움카드
- 어쩌다 마케팅
- harkerrank
- 오블완
- 파이썬 철저입문
- 파이썬 철저 입문
- 프로그래머스
- 파이썬 머신러닝 완벽 가이드
- hackerrank
- TiL
- 티스토리챌린지
- 중회귀모형
- 내일배움
- SQL
- 프로젝트
- 파이썬
- R
- 미세먼지
- 텍스트 분석
- 파이썬 머신러닝 완벽가이드
- 스파르타 코딩
- 회귀분석
- Cluster
- 웹 스크랩핑
- 스파르타코딩
- wil
- Today
- Total
OkBublewrap
서울특별시 대기분석 본문
<데이터 정보>
https://cleanair.seoul.go.kr/statistics/monthAverage
서울특별시 대기환경정보 - 기간별 통계(월별 평균)
측정기간 연도 2021 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 --> 1월 --> --> --> --> 측정물질 오염물질 초
cleanair.seoul.go.kr
1. 가설 설정
$$ H_{0} : 강서구 미세먼지 와 강동구 미세먼지 평균이 같다 $$
$$ H_{1} : 강서구 미세먼지 와 강동구 미세먼지 평균이 같지 않다 $$
2. 데이터 전처리
dust <- read_excel("C:/Temp1/month.xlsx")
View(dust)
str(dust)
dust_area <- dust %>% filter(구분 %in% c('강서구','강동구'))
View(dust_area)
str(dust_area)
gange <- c(46,46,45,44,33,37,21,24,20,36,46,45)
gangw <- c(53,46,49,45,36,36,21,23,19,36,50,45)
boxplot(gange,gangw)
t.test(gange, gangw)
3. 데이터 시각화
Welch Two Sample t-test
data: gange and gangw
t = -0.2954, df = 21.553, p-value = 0.7705
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-10.705214 8.038547
sample estimates:
mean of x mean of y
36.91667 38.25000
4. 결론
강서구, 강동구의 미세먼지 평균은 다르다고 할 수 있다. 강서구 평균 : 38.25, 강동구 평균 : 36.91667 중국에 더 가깝기 때문에 이러한 영향이 있다고 판단이 된다.
'R > 프로젝트' 카테고리의 다른 글
지하철 아파트 가격 상관관계 (0) | 2021.07.19 |
---|---|
서울 특별시 공연장 분포표 (0) | 2021.07.07 |