해당 글은 코드잇 강의를 참고하여 작성되었습니다.
- 데이터 퀄리티의 중요성
- 데이터를 분석하는데 정확성을 높여주고 타당한 의사결정을 할 수 있게 한다.
- 좋은 데이터의 기준 : 완결성
- 필수항목이 모두 채워져 있어야 완결성이 있다고 할 수 있다. → 결측값 확인
- 좋은 데이터의 기준 : 유일성
- 동일한 데이터가 불필요하게 중복되어 있으면 안된다.
- 좋은 데이터의 기준 : 통일성
- 데이터가 동일한 형식으로 저장되어야 한다.
- 좋은 데이터의 기준 : 정확성
- 데이터가 정확해야 한다. → 분석에 혼란을 일으킬 수 있기 때문
- 이상점 확인
'데이터 > 데이터사이언스입문' 카테고리의 다른 글
5.1 데이터를 만드는 방법 (0) | 2021.07.14 |
---|---|
4.2 데이터 클리닝 (0) | 2021.07.13 |
3.5 새로운 인사이트 발견하기 (0) | 2021.07.12 |
3.4 Exploratory Data Analysis (0) | 2021.07.10 |
3.3 통계 기본 상식 (0) | 2021.07.09 |