분류 전체보기

개인공간

평소에 듣는 유튜브 노래모음집

보호되어 있는 글입니다.

머신러닝/머신러닝 수학

상관계수 개념정리(피어슨 상관계수 ) - [머신러닝 수학]

※ 모바일 주의사항 ※ 모바일 이용시 $ Latex수식 $이 적용되지 않는거 같습니다. 수식적용하는 script가 PC웹페이지에만 적용되는거 같습니다. 모바일은 쏴리.. 상관계수 상관계수? 산점도에서 점들이 얼마나 직선에 가까운지를 타나내는 척도를 상관계수 라고 한다. 아래 그림을 보며 설명을 하자면, p의 값이 $ X_1 X_2$ 특징에 대해서 얼마나 직선적인 경향을 나타내는가를 수치로 수치로 표현한 것이다. (a)의 그림같은 경우 산점도를보면 다양하게 퍼져있기 때문에 상관계수 = 0의 값을 가지고 (b)의 경우 우상향의 직선에 가까운 산점도를 가지기 때문에 양의 상관관계를 가지며 상관계수 = 1이다. (c)의 경우조금 퍼져있기는 하지만 음의 상관관계의 성질을 가지기 때문에 상관계수 = -0.7 이다...

머신러닝/머신러닝 알고리즘

SVM(Support Vector Machine) 서포트 벡터 머신 정리 - [머신러닝]

서포트 벡터 머신은 분류 과제에 사용할 수 있는 머신러닝 지도학습 모델 즉, 분류를 위한 기준 선을 정의하는 모델이며 분류되지 않은 새로운 점이 나타나면 어느 쪽에 속하는지 확인해서 분류 과제를 수행할 수 있게 됨 어떤 선이 데이터를 분류할 최적의 선인가? SVM은 결정 경계(경계선)을 어떻게 정의하고 계산하는지 이해하는게 중요함. 용어정리 Support Vector : 경계선과 가장 가까이 있는 데이터 포인트 구분선(Decision Boundary) : 데이터를 구분하는 경계선 마진(Margin) : 구분하는 선과 Support Vector와의 거리 Support Vector(데이터 포인트) 마진을 최대화하여 구분선을 그으면, 예측하고자 하는 다른 데이터가 들어왔을 때 정확도가..

머신러닝/머신러닝 알고리즘

교차검증 통한 머신러닝 모델 성능 평가(K-Fold, Leave-one-out, Shuffle-Split) - [머신러닝]

교차검증은 모델의 학습 과정에서 모델 생성을 위한 데이터셋을 학습(Training) / 검증(Validation) 데이터를 나눌 때 Validation데이터 셋에만 학습이 과적합 되어버리는 결과를 방지하기 위한 방법 * 즉, 내가 만든 모델을 평가 했을 때 내 Train 데이터 셋에만 결괏값이 잘 나오는 것을 방지하기 위함. 교차검증의 장점 모든 데이터 셋을 평가에 활용 가능 데이터의 편향적인 영향을 받지 않음 교차검증의 단점 역시나, 학습 횟수가 많아 훈련/평가 시간이 오래걸림. HoldOut 방법 HoldOut 방식은 Train : Validation의 비율을 정해 사용하는 방식, 예를 들면 7:3의 비율을 정해놓고 모델 학습 진행 K-Fold 방법 모델의 학습 과정에서 모델 생성을 ..

1Seok
'분류 전체보기' 카테고리의 글 목록 (18 Page)