Deep Learning 공부자료/모두를 위한 딥러닝

Lec01) Machine Learning 용어와 개념 정리

글른 2020. 3. 10. 00:22

Machine Learning

더보기

일종의 software - explicit programming의 한계를 극복하기 위해 개발 되었다.

Field of study that gives computers the ability to learn without being explicitly programmed. (Arthr Samuel)

 

Supervised / Unsupervised Learning

학습하는 방식에 따라서 나뉘어짐

학습 : 데이터를 특별한 알고리즘에 적용해 머신러닝 모델을 정의된 문제에 최적화하는 것

 

Supervised Learning : 정해져 있는 labeled example을 training set으로 학습

정답을 알려주면서 진행되는 학습. 학습 시 데이터와 함께 label(정답)이 제공 되어야한다.

장점 - 데이터와 함께 label을 제공해서 손쉽게 모델의 성능을 평가할 수 있다.

단점 - label을 달기 위해 많은 시간을 투자해야 한다.

예 - classification, regression

 

Unsupervised Learning : labeling 할 수 없는 data를 training set으로 학습

정답 없이 진행되는 학습. 학습 시 데이터만 제공된다. 데이터 자체에서 패턴을 찾아내야 할 때 사용한다.

장점 - 따로 label을 제공할 필요가 없다.

단점 - label이 없어서 모델의 성능을 평가하기에 한계가 있다.

예 - clustering, dimensional reduction

 

Training Data Set

training set 이용해서 모델을 학습 시킨다.

 

Types of Supervised

분류와 회기의 차이점 : 데이터가 입력됐을 때, 분류는 분리된 값으로 예측, 회귀는 연속된 값으로 예측한다.

  • Binary Classification : 이진으로 나눠서 예측 ex) predicting final exam pass / non-pass based on time spent
  • Multi Label Classification : 여러 카테고리로 나눠서 예측 ex) predicting letter grade based on time spent
  • Regression : 넓은 범위에서 예측 ex) predicting final exam score based on time spent