본문 바로가기

데이터/데이터사이언스입문

3.4 Exploratory Data Analysis

해당 글은 코드잇 강의를 참고하여 작성되었습니다.

- EDA란? 

  • DataSet을 다양한 관점에서 살펴보고 탐색하면서 인사이트를 찾는 것

 

- 기본 정보 파악하기

앞에서 배운 seaborn도구나 value_counts 등으로 전체적인 분포와 같은 정보를 파악한다.

 

- 상관 관계 분석

  • 예시

 

- 클러스터 분석

  • 데이터를 몇가지 무리로 나누어 분석
  • corr에 선택한 column들의 row의 상관계수를 넣는다.

 

'데이터 > 데이터사이언스입문' 카테고리의 다른 글

4.1 좋은 데이터의 기준  (0) 2021.07.13
3.5 새로운 인사이트 발견하기  (0) 2021.07.12
3.3 통계 기본 상식  (0) 2021.07.09
3.2 Seaborn 시각화  (0) 2021.07.09
3.1 시각화와 그래프  (0) 2021.07.09