OkBublewrap

데이터 분석 본문

R/학습용

데이터 분석

옥뽁뽁 2021. 5. 21. 11:18

분석과정

1. 분석설계 (방향성 기획, 방법론 검토, 가설 설정)

2. 데이터 준비(데이터 불러오기, 형태 파악하기)

3. 데이터 가공(추출 및 정제, 파생 변수 생성, 데이터 병합)

4. 데이터 분석(통계 분석, 그래프 그리기)

5.결론 도출(분석 결과해석, 분석결과정리)

 

데이터의 각 요소와 명칭

1. 데이터 세트 : 행과 열로 이루어진 데이터 구조

2. 행 : 데이터 세트의 가로 영역으로 관측치라고도 부름(row)

3. 열: 데이터 세트의 세로 영역으로 변수라고도 부름(colum)

4. 데이터 값 : 관측된 값

 

데이터 종류

구분 1차원 2차원 n차원
단일형 벡터 행렬 배열
다중형 리스트 데이터 프레임 -

 

데이터 구조

vertor <- c(1,2,3)
str(vertor)

num [1:3] 1 2 3

숫자형 벡터

 

vector1 <- c('hello')
str(vector1)

chr "hello"

문자형 벡터

 

vector2 <- c(TRUE)
str(vector2)

logi TRUE

논리형 벡터

 

데이터의 구조(행렬과 배열)

x <- c(1:10)
matrix(x, nrow = 2, ncol = 5)

     [,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10

 

2*5 행렬

y <- c(1:10)
array(y, dim = c(2,2,2))

, , 1

     [,1] [,2]
[1,]    1    3
[2,]    2    4

, , 2

     [,1] [,2]
[1,]    5    7
[2,]    6    8

 

2*2*2 배열

 

리스트와 데이터 프레임

i <- list(c(1:10))

[[1]]
 [1]  1  2  3  4  5  6  7  8  9 10

 

List of 1
 $ : int [1:10] 1 2 3 4 5 6 7 8 9 10

score <- c(80,70,80,100)
age <- c(20,20,25,34)

dataframe <- data.frame(score, age)
dataframe

  score age
1    80  20
2    70  20
3    80  25
4   100  34

 

'data.frame': 4 obs. of  2 variables:
 $ score: num  80 70 80 100
 $ age  : num  20 20 25 34

 

 

'R > 학습용' 카테고리의 다른 글

히트맵  (0) 2021.06.23
reshape2  (0) 2021.05.28
dpylr 패키지  (0) 2021.05.26
ggplot2  (0) 2021.05.25
데이터 전처리  (0) 2021.05.24