안녕하세요 jay입니다.
오늘은 딥러닝 전체 구조 및 학습 과정에 대해 알아보도록 하겠습니다.
0. 딥러닝 전체 구조
대부분 딥러닝 모델은 위와 같은 과정을 거칩니다. 단계별로 어떤 역할을 하는지에 대해 알아보도록 하겠습니다.
1. Data
- 이 데이터는 학습시키기 위한 데이터입니다.
- 학습하기 적합한 데이터를 만들기 위해 전처리 과정을 반드시 거칩니다.
2. Model
- LeNet, ResNet등 다양한 모델이 있습니다.
- Convolution Layer, Pooling, Drop out등 다양한 Layer로 구성되어있습니다.
- 전처리된 데이터를 모델에 넣고 학습을 시킵니다.
3. Prediction
- 각 클래스 별로 모델이 예측한 값을 의미합니다.
- 예를 들어 0~9까지 숫자를 예측하는 모델이라고 가정을 해봅시다.
- 4와 비슷한 이미지(data)가 모델에 들어올 경우, 좋은 모델일 경우 아래와 같이 예측을 할 가능성이 높습니다.
- [0.1, 0.1, 0.05, 0.05, 0.4, 0.05, 0.05, 0.05, 0.05 , 0.1]
- 0부터 9까지 이므로 4일때 가장 높게 예측했다는 것을 알 수 있습니다.
4. Loss(Cost)
- 예측한 값과 정답과 비교해서 얼마나 틀렸는지 계산을 하는 과정, 나온 값이 Loss(Cost)
- Loss를 최대한 줄이는 것이 목표
- Cross Entropy등 다양한 Loss function이 있음(Classification, Regression이냐에 따라 다름)
5. Optimization
- Loss를 최대한 줄이는 과정을 뜻합니다.
- 기존의 딥러닝 모델의 Weight를 조정하면서 최적화를 진행합니다.
- 대표적으로 SGD, Adam등이 있습니다.
6. Result
- Accuracy, Precision, Recall등 모델에서 나온 최적의 결과를 다양한 평가지표로
- 평가하는 과정을 뜻합니다.
댓글
댓글 쓰기