본문 바로가기

데이터/머신러닝

1.1 머신러닝이란?

해당 글은 코드잇 강의를 참고하여 작성되었습니다.

- 머신 러닝이란?

  • Machine Learning(기계학습) : 기계가 학습을 통해 발전하는 것
  • 경험을 통해 스스로 업무 능력 향상
  • 새로운 데이터를 받아 직접 규칙찾기
  • 기계가 학습한다는 건, 프로그램이 특정 작업을 하는 데 있어서 경험을 통해 작업의 성능을 향상시키는 것

 

- 머신 러닝이 핫해진 이유

  1.  사용할 수 있는 데이터가 많아졌다
  2.  컴퓨터 성능이 좋아졌다
  3.  활용성이 증명되었다

 

- 인공 지능? 빅 데이터? 머신 러닝?

빅데이터 인공지능 딥러닝
데이터 보관/처리법 프로그램이 인간처럼 생각하고
행동하게 하는 학문
머신러닝 기법 중 하나
데이터 분석 방법들

 

- 학습의 유형

  1. 지도학습 : "답"이 있고 이 답을 맞추는 게 학습의 목적
    • 분류(Classification) : Y/N
    • 회귀(Regression) : 연속적인 값을 가짐
  2. 비지도학습 : "답"이 없고 이 답을 맞추는 게 학습의 목적
  3. 강화학습

 

- K-NN 알고리즘

  • k 최근접 이웃 알고리즘
  • 예측하고 싶은 값에서 가장 가까운 k개를 찾아 다수결 (많은 경험이 있어야 머신러닝 가능)

 

- 머신 러닝의 수학

  • 선형대수 → 행렬 : 많은 데이터를 하나로 묶을 수 있고 계산도 효율적이다.
  • 미분 → 함수 : 최소/최댓값 추론하여 최적화
  • 통계 : 많은 데이터의 특징 파악해 예측
  • 확률 : 예측