Supervised Learning 이란,
Machine Learning 뿐만 아니라 패턴인식 자연어 처리등 여러 분야에서 널리사용하는 방법이다. 이미 Labeling 된 Data를 가지고, 학습하여 새로운 Data가 들어왔을 때 Data를 Classification 시키는 것이 목적이다.
Evaluation and Error Analysis
Data set 이
(1) Training set (90%)
(2) Test set (10%)
로 구성되어 있다.
Cross validation(k-fold cross validation)
만약 300개의 Data에 대해 training 시킨다고 가정했을때,(그러나 더 못하는 상황일때)
오직 300개의 Data를 30개씩(1~30번) 10등분해서 Test set(Validation이라 할수 있다)으로 활용한다
그 10가지 set 을 repeat 하면서 러닝을 수행한다.
그러면 결론적으로 Validation을 활용하여 Error를 낮추어 분류 정확성을 높일수 있다.
Example of 10-fold cross validation
'For Study' 카테고리의 다른 글
[Study] t-test란? (0) | 2013.09.11 |
---|---|
[Study] A * Algorithm 구현까지 (1) | 2013.04.21 |
[Study] A star Algorithm(A 스타 알고리즘, A* 알고리즘) (0) | 2013.04.17 |