Deep Learning 공부자료/모두를 위한 딥러닝
Lec01) Machine Learning 용어와 개념 정리
글른
2020. 3. 10. 00:22
Machine Learning
더보기
일종의 software - explicit programming의 한계를 극복하기 위해 개발 되었다.
Field of study that gives computers the ability to learn without being explicitly programmed. (Arthr Samuel)
Supervised / Unsupervised Learning
학습하는 방식에 따라서 나뉘어짐
학습 : 데이터를 특별한 알고리즘에 적용해 머신러닝 모델을 정의된 문제에 최적화하는 것
Supervised Learning : 정해져 있는 labeled example을 training set으로 학습
정답을 알려주면서 진행되는 학습. 학습 시 데이터와 함께 label(정답)이 제공 되어야한다.
장점 - 데이터와 함께 label을 제공해서 손쉽게 모델의 성능을 평가할 수 있다.
단점 - label을 달기 위해 많은 시간을 투자해야 한다.
예 - classification, regression
Unsupervised Learning : labeling 할 수 없는 data를 training set으로 학습
정답 없이 진행되는 학습. 학습 시 데이터만 제공된다. 데이터 자체에서 패턴을 찾아내야 할 때 사용한다.
장점 - 따로 label을 제공할 필요가 없다.
단점 - label이 없어서 모델의 성능을 평가하기에 한계가 있다.
예 - clustering, dimensional reduction
Training Data Set
Types of Supervised
분류와 회기의 차이점 : 데이터가 입력됐을 때, 분류는 분리된 값으로 예측, 회귀는 연속된 값으로 예측한다.
- Binary Classification : 이진으로 나눠서 예측 ex) predicting final exam pass / non-pass based on time spent
- Multi Label Classification : 여러 카테고리로 나눠서 예측 ex) predicting letter grade based on time spent
- Regression : 넓은 범위에서 예측 ex) predicting final exam score based on time spent