일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 파이썬 완벽 가이드
- 텍스트 분석
- harkerrank
- 미세먼지
- 중회귀모형
- 파이썬 머신러닝 완벽 가이드
- 프로젝트
- Cluster
- 실전 데이터 분석 프로젝트
- 파이썬 머신러닝 완벽가이드
- 내일배움캠프
- 파이썬 철저입문
- 웹 스크랩핑
- 스파르타 코딩
- 회귀분석
- 내일배움카드
- 파이썬
- 프로그래머스
- hackerrank
- TiL
- SQL
- R
- 티스토리챌린지
- 파이썬 철저 입문
- 오블완
- wil
- MySQL
- 스파르타코딩
- 스파르타
- 내일배움
- Today
- Total
OkBublewrap
데이터 분석 본문
분석과정
1. 분석설계 (방향성 기획, 방법론 검토, 가설 설정)
2. 데이터 준비(데이터 불러오기, 형태 파악하기)
3. 데이터 가공(추출 및 정제, 파생 변수 생성, 데이터 병합)
4. 데이터 분석(통계 분석, 그래프 그리기)
5.결론 도출(분석 결과해석, 분석결과정리)
데이터의 각 요소와 명칭
1. 데이터 세트 : 행과 열로 이루어진 데이터 구조
2. 행 : 데이터 세트의 가로 영역으로 관측치라고도 부름(row)
3. 열: 데이터 세트의 세로 영역으로 변수라고도 부름(colum)
4. 데이터 값 : 관측된 값
데이터 종류
구분 | 1차원 | 2차원 | n차원 |
단일형 | 벡터 | 행렬 | 배열 |
다중형 | 리스트 | 데이터 프레임 | - |
데이터 구조
vertor <- c(1,2,3)
str(vertor)
num [1:3] 1 2 3
숫자형 벡터
vector1 <- c('hello')
str(vector1)
chr "hello"
문자형 벡터
vector2 <- c(TRUE)
str(vector2)
logi TRUE
논리형 벡터
데이터의 구조(행렬과 배열)
x <- c(1:10)
matrix(x, nrow = 2, ncol = 5)
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10
2*5 행렬
y <- c(1:10)
array(y, dim = c(2,2,2))
, , 1
[,1] [,2]
[1,] 1 3
[2,] 2 4
, , 2
[,1] [,2]
[1,] 5 7
[2,] 6 8
2*2*2 배열
리스트와 데이터 프레임
i <- list(c(1:10))
[[1]]
[1] 1 2 3 4 5 6 7 8 9 10
List of 1
$ : int [1:10] 1 2 3 4 5 6 7 8 9 10
score <- c(80,70,80,100)
age <- c(20,20,25,34)
dataframe <- data.frame(score, age)
dataframe
score age
1 80 20
2 70 20
3 80 25
4 100 34
'data.frame': 4 obs. of 2 variables:
$ score: num 80 70 80 100
$ age : num 20 20 25 34