데이터분석

머신러닝/머신러닝 알고리즘

교차검증 통한 머신러닝 모델 성능 평가(K-Fold, Leave-one-out, Shuffle-Split) - [머신러닝]

교차검증은 모델의 학습 과정에서 모델 생성을 위한 데이터셋을 학습(Training) / 검증(Validation) 데이터를 나눌 때 Validation데이터 셋에만 학습이 과적합 되어버리는 결과를 방지하기 위한 방법 * 즉, 내가 만든 모델을 평가 했을 때 내 Train 데이터 셋에만 결괏값이 잘 나오는 것을 방지하기 위함. 교차검증의 장점 모든 데이터 셋을 평가에 활용 가능 데이터의 편향적인 영향을 받지 않음 교차검증의 단점 역시나, 학습 횟수가 많아 훈련/평가 시간이 오래걸림. HoldOut 방법 HoldOut 방식은 Train : Validation의 비율을 정해 사용하는 방식, 예를 들면 7:3의 비율을 정해놓고 모델 학습 진행 K-Fold 방법 모델의 학습 과정에서 모델 생성을 ..

1Seok
'데이터분석' 태그의 글 목록