본문 바로가기

데이터/데이터사이언스입문

4.1 좋은 데이터의 기준

해당 글은 코드잇 강의를 참고하여 작성되었습니다.

- 데이터 퀄리티의 중요성

  • 데이터를 분석하는데 정확성을 높여주고 타당한 의사결정을 할 수 있게 한다.

 

- 좋은 데이터의 기준 : 완결성

  • 필수항목이 모두 채워져 있어야 완결성이 있다고 할 수 있다. → 결측값 확인

 

- 좋은 데이터의 기준 : 유일성

  • 동일한 데이터가 불필요하게 중복되어 있으면 안된다. 

 

- 좋은 데이터의 기준 : 통일성

  • 데이터가 동일한 형식으로 저장되어야 한다.

 

- 좋은 데이터의 기준 : 정확성

  • 데이터가 정확해야 한다. → 분석에 혼란을 일으킬 수 있기 때문
  • 이상점 확인

'데이터 > 데이터사이언스입문' 카테고리의 다른 글

5.1 데이터를 만드는 방법  (0) 2021.07.14
4.2 데이터 클리닝  (0) 2021.07.13
3.5 새로운 인사이트 발견하기  (0) 2021.07.12
3.4 Exploratory Data Analysis  (0) 2021.07.10
3.3 통계 기본 상식  (0) 2021.07.09