딥러닝 전체 구조 및 학습과정

안녕하세요 jay입니다.
오늘은 딥러닝 전체 구조 및 학습 과정에 대해 알아보도록 하겠습니다.

0. 딥러닝 전체 구조

대부분 딥러닝 모델은 위와 같은 과정을 거칩니다. 단계별로 어떤 역할을 하는지에 대해 알아보도록 하겠습니다.

1. Data
  • 이 데이터는 학습시키기 위한 데이터입니다. 
  • 학습하기 적합한 데이터를 만들기 위해 전처리 과정을 반드시 거칩니다.


2. Model
  • LeNet, ResNet등 다양한 모델이 있습니다.
  • Convolution Layer, Pooling, Drop out등 다양한 Layer로 구성되어있습니다.
  • 전처리된 데이터를 모델에 넣고 학습을 시킵니다.


3. Prediction
  • 각 클래스 별로 모델이 예측한 값을 의미합니다. 
  • 예를 들어 0~9까지 숫자를 예측하는 모델이라고 가정을 해봅시다.
  • 4와 비슷한 이미지(data)가 모델에 들어올 경우, 좋은 모델일 경우 아래와 같이 예측을 할 가능성이 높습니다.
  • [0.1,  0.1,  0.05,  0.05,  0.4,  0.05, 0.05, 0.05, 0.05 , 0.1]
  • 0부터 9까지 이므로 4일때 가장 높게 예측했다는 것을 알 수 있습니다.


4. Loss(Cost)
  • 예측한 값과 정답과 비교해서 얼마나 틀렸는지 계산을 하는 과정, 나온 값이 Loss(Cost)
  • Loss를 최대한 줄이는 것이 목
  • Cross Entropy등 다양한 Loss function이 있음(Classification, Regression이냐에 따라 다름)

5. Optimization
  • Loss를 최대한 줄이는 과정을 뜻합니다.
  • 기존의 딥러닝 모델의 Weight를 조정하면서 최적화를 진행합니다.
  • 대표적으로 SGD, Adam등이 있습니다.

6. Result
  • Accuracy, Precision, Recall등 모델에서 나온 최적의 결과를 다양한 평가지표로
  • 평가하는 과정을 뜻합니다.




댓글