모두를 위한 딥러닝 정리 1장 - 기본적인 머신러닝의 용어와 개념 설명

안녕하세요 jay입니다.
한국에서 머신러닝 공부를 해봤다하시는 분들은
꼭 한 번 들어보셨을 김성훈 교수님의 "모두를 위한 딥러닝"을
정리를 해보도록 하겠습니다!

강의 : https://www.youtube.com/watch?v=qPMeuL2LIqY&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=2

What is ML? 머신러닝이란 무엇인가?

Limitations of explicit programming(explicit programming의 한계)
explicit programming :프로그래머가 구체적으로 규칙을 정해주는 프로그래밍 기법
ex) A조건에선 B하라

explicit programming으로 많은 프로그램들을 짤 수 있지만
스팸 필터링이나 자율주행 자동차에선 이와 같은 기법을 사용하기 어렵다.
왜냐하면 너무 많은 경우의 수가 있기 때문에 모든 경우에 대해 규칙을 정할 수가 없기 때문이다.

1959년 Arthur Samul은 explicit programming 방식이 아닌
프로그램이 데이터를 통해 스스로 학습을 해서 배우는 능력을 갖는 프로그래밍 기법을 고안했다.
그것이 바로 머신러닝이다.

 Supervised/Unsupervised Learning

머신러닝에서 학습하는 방법에 따라 Supervised Learning, Unsupervised Learning으로 구분할 수 있다.

Supervised Learning(지도 학습) : 정해져있는(label) 데이터(training set)을 가지고 학습

ex) 이미지를 주면 개인지 고양이인지 분류하는 프로그램
고양이와 강아지 사진에다가 Cat, Dog라는 label을 단 뒤
컴퓨터에게 학습을 시켜서 개와 고양이를 구분할 수 있게함

Unsupervised Learning(비지도 학습) : 정해져있지 않은 (Unlabel) 데이터를 가지고 학습
사전에 label에 대한 지도가 없는 학습

ex) Word clustering 비슷한 단어끼리 모음


Type of supervised learning

Regression(회귀)

Predicting final exam score based on time spent
자신이 공부한 시간을 기반으로 시험 성적(0점~100점)을 예측을 한다.
0에서 100까지의 연속적인 값을 예측하는 방법을 regression(회귀)라고 한다.

Binary classification(이진 분류)

Pass/non-pass based on time spent
시험 성적을 패스/논패스로 예측한다
즉 시험성적을 두가지 중 하나로 분류하기 때문에 binary classification이라고 한다.

Multi-label-classification (다중 분류)

Letter grade(A,B,C,D and F) based  on time spent
시험 성적을 두 가지가 아닌 세가지 이상 label중 한가지로 분류하기 때문에
multi-label-classification이라고 한다.

댓글