머신러닝

머신러닝/머신러닝 수학

시그모이드 함수 미분법 Sigmoid Differential 정리 - [머신러닝]

시그모이드 함수 미분 알아야할 수학 개념 미분 몫의 미분법 지수 미분 규칙 자연로그 e 도함수 공식 1) 몫의 미분법 ※ $ \frac{1}{1+e^{-x}} $ 를 미분하기 위해서 알아야할 개념 2) 도함수 공식 3) 지수 미분 규칙 4) 시그모이드 미분 정리 - 미분 결과 유도 가능 - $$ Sig(x) * (1 - Sig(x)) $$

머신러닝/머신러닝 알고리즘

로지스틱 회귀 Logistic Regression, 로지스틱 손실 함수 Cost Function For Logistic 개념 및 정리 - [머신러닝]

로지스틱 회귀가 무엇인가? 로지스틱회귀는 분석하고자 하는 대상(특징)이 2개 or 그 이상의 집단으로 나누어져 있을 때, 개별 관측치(개별 특징)들이 어느 집단에 분류될 수 있는지에 대해 분석하고 예측하는 모델을 개발하는 통계적 기법이다. 대표적으로 예를들면 회사 직원들의(연봉, 야근횟수, 복지, 업무 적합도)등의 연속형 자료를 통해서, (퇴사한다, 안한다)를 분류하는 Yes/No의 비율을 다루는 분석방법이다. 로지스틱 회귀의 종류 1) 이항 로지스틱 회귀(Binary Logistic Regression) - Sigmoid함수들을 이용한 2가지 결과만으로 분류 2) 다항 로지스틱 회귀(Multinomial Logistic Regression) - Softmax(소프트맥스)함수를 이용한 2개 이상의 분류 ..

머신러닝/머신러닝 알고리즘

선형회귀 Linear Regression 개념 및 예제 학습 - [머신러닝]

선형회귀 머신러닝을 공부하며 선형회귀를 다들 귀에익을 정도로 들었을 것이다. 그래서 선형회귀가 무엇인가? 선형회귀는 변수들 간의 함수관계를 분석하는 방법으로, 독립변수가 종속변수에 미치는 영향력의 크기를 파악하고, 이를 통해 독립변수의 일정한 값에 대응하는 종속변수 값을 예측하는 모형을 산출하는 방법 자 저런 말들은 머리로 이해하는데 직관적으로 와닫지 않는다. 우리는 어려운 말에는 예제를 들어가며 쉬운 길을 찾는다. 그래서 선형회귀를 쉽게이해 하기위해 예를 들어보면은 년도수를 X에 두고, 강남 아파트 가격 데이터를 Y라고 한다. Year과 강남아파트 Price의 데이터 점들을 통해서 두 변수의 관계를 가장 잘 나타내줄 수 있는 최적의 직선을 긋는다. 직선의 방정식 $ Y = aX+b $ X에 Year대입..

머신러닝/머신러닝 수학

상관계수 개념정리(피어슨 상관계수 ) - [머신러닝 수학]

※ 모바일 주의사항 ※ 모바일 이용시 $ Latex수식 $이 적용되지 않는거 같습니다. 수식적용하는 script가 PC웹페이지에만 적용되는거 같습니다. 모바일은 쏴리.. 상관계수 상관계수? 산점도에서 점들이 얼마나 직선에 가까운지를 타나내는 척도를 상관계수 라고 한다. 아래 그림을 보며 설명을 하자면, p의 값이 $ X_1 X_2$ 특징에 대해서 얼마나 직선적인 경향을 나타내는가를 수치로 수치로 표현한 것이다. (a)의 그림같은 경우 산점도를보면 다양하게 퍼져있기 때문에 상관계수 = 0의 값을 가지고 (b)의 경우 우상향의 직선에 가까운 산점도를 가지기 때문에 양의 상관관계를 가지며 상관계수 = 1이다. (c)의 경우조금 퍼져있기는 하지만 음의 상관관계의 성질을 가지기 때문에 상관계수 = -0.7 이다...

머신러닝/머신러닝 알고리즘

SVM(Support Vector Machine) 서포트 벡터 머신 정리 - [머신러닝]

서포트 벡터 머신은 분류 과제에 사용할 수 있는 머신러닝 지도학습 모델 즉, 분류를 위한 기준 선을 정의하는 모델이며 분류되지 않은 새로운 점이 나타나면 어느 쪽에 속하는지 확인해서 분류 과제를 수행할 수 있게 됨 어떤 선이 데이터를 분류할 최적의 선인가? SVM은 결정 경계(경계선)을 어떻게 정의하고 계산하는지 이해하는게 중요함. 용어정리 Support Vector : 경계선과 가장 가까이 있는 데이터 포인트 구분선(Decision Boundary) : 데이터를 구분하는 경계선 마진(Margin) : 구분하는 선과 Support Vector와의 거리 Support Vector(데이터 포인트) 마진을 최대화하여 구분선을 그으면, 예측하고자 하는 다른 데이터가 들어왔을 때 정확도가..

머신러닝/머신러닝 알고리즘

교차검증 통한 머신러닝 모델 성능 평가(K-Fold, Leave-one-out, Shuffle-Split) - [머신러닝]

교차검증은 모델의 학습 과정에서 모델 생성을 위한 데이터셋을 학습(Training) / 검증(Validation) 데이터를 나눌 때 Validation데이터 셋에만 학습이 과적합 되어버리는 결과를 방지하기 위한 방법 * 즉, 내가 만든 모델을 평가 했을 때 내 Train 데이터 셋에만 결괏값이 잘 나오는 것을 방지하기 위함. 교차검증의 장점 모든 데이터 셋을 평가에 활용 가능 데이터의 편향적인 영향을 받지 않음 교차검증의 단점 역시나, 학습 횟수가 많아 훈련/평가 시간이 오래걸림. HoldOut 방법 HoldOut 방식은 Train : Validation의 비율을 정해 사용하는 방식, 예를 들면 7:3의 비율을 정해놓고 모델 학습 진행 K-Fold 방법 모델의 학습 과정에서 모델 생성을 ..

1Seok
'머신러닝' 태그의 글 목록