해당 글은 코드잇 강의를 참고하여 작성되었습니다.
- EDA란?
- DataSet을 다양한 관점에서 살펴보고 탐색하면서 인사이트를 찾는 것
- 기본 정보 파악하기
앞에서 배운 seaborn도구나 value_counts 등으로 전체적인 분포와 같은 정보를 파악한다.
- 상관 관계 분석
- 예시
- 클러스터 분석
- 데이터를 몇가지 무리로 나누어 분석
- corr에 선택한 column들의 row의 상관계수를 넣는다.
'데이터 > 데이터사이언스입문' 카테고리의 다른 글
4.1 좋은 데이터의 기준 (0) | 2021.07.13 |
---|---|
3.5 새로운 인사이트 발견하기 (0) | 2021.07.12 |
3.3 통계 기본 상식 (0) | 2021.07.09 |
3.2 Seaborn 시각화 (0) | 2021.07.09 |
3.1 시각화와 그래프 (0) | 2021.07.09 |