OkBublewrap

2024-12-17 TIL (양질의 데이터3) 본문

Today I Learning

2024-12-17 TIL (양질의 데이터3)

옥뽁뽁 2024. 12. 17. 09:14

아티클 # 11

 

양질의 데이터를 판별하는 5가지 방법 : ③ 관계형 데이터베이스인가? | 요즘IT

보통 빅데이터의 특성을 이야기할 때 3V라는 단어를 언급하는 경우가 많습니다. Velocity(속도), Volume(양), Variety(다양성)까지 V로 시작하는 3가지 단어의 묶음입니다. 이때 Variety(다양성)이라는 단

yozm.wishket.com

 

1. 아티클 주요 내용 요약

  • 핵심 주제: 데이터 베이스
  • 주요 내용:
    • 빅데이터 특성 3V(Velocity(속도), Volume(양), Variety(다양성))
    • 관계형 데이터베이스
      보유한 다른 데이터와 유기적으로 연결하여 더 넓은 시야를 가질 수 있도록 데이터를 분석하려면 관계형 데이터베이스 양식을 따라야 하는 것이 선제 조건
    • Key의 존재(데이터에 키가 없다면 이 데이터가 어떤 개인 혹은 상황을 의미하는지 전혀 파악할 수 없습니다.)
    • 데이터에 키가 없다면 다른 데이터 테이블과 결합을 하는 게 불가능합니다.
    • 유일성, 무결성
      1) 유일성 : 하나의 키가 하나의 식별 값을 정확히 식별할 수 있을 때, 무결성은 데이터에서 키값이 비어 있거나 중복되지 않아야 함을 이야기하는 조건입니다.
      2) 무결성 : 데이터에서 키값이 비어 있거나 중복되지 않아야 함을 이야기하는 조건입니다.
    • 최종적으로 우리가 양질의 데이터를 판별하기 위해 할 것은 키의 후보군을 찾고 키과 유일성과 무결성을 만족시키고 있는지 확인

2. 인사이트 및 배운 점

  • 배운 점 : 관계형 데이터베이스(RDMS)의 키의 유일성, 무결성 특징

 

3. 생각 및 의견

  • 나의 의견 : 대부분 ID가 키값이 많이 되는것을 본 적이 있다. 
     

 

4. 추가 학습 계획

관계형이 아닌 NoSQL 대해서도 좀 공부해야겠다.

 

 


 

 

'Today I Learning' 카테고리의 다른 글

2024-12-19 TIL (양질의 데이터4)  (0) 2024.12.19
2024-12-18 TIL (Retension)  (0) 2024.12.18
2024-12-16 TIL (데이터 스토리텔링)  (0) 2024.12.16
WIL - 3주차  (2) 2024.12.13
2024-12-13 TIL (Rentension, Python 배열합치기)  (2) 2024.12.13