공부/AI School 인공지능 여름캠프

공부/AI School 인공지능 여름캠프

머신러닝 의사결정트리(Decision Tree), 앙상블, 엔트로피 - [AI School]

의사결정트리, 앙상블 의사결정 트리를 이해하기 앙상블의 여러가지 방법을 이해하기 랜덤 포레스트에 대한 설명 의사결정트리 데이터를 분석해서 이들 사이에 존재하는 패턴을 예측 가능한 규칙들의 조합을 트리를 뒤집어 놓은 모양으로 나타낸 것 운동경기가 열렸다면 Play = 1, 그렇지 않으면 Play = 0 으로 분류 날씨가 맑고, 습도가 70이하 인날 경기가 열렸다. 비가 오고 바람이 부는 날에는 경기가 열리지 않았다. 특징 중간의 Terminal node 가 3개라는 것은 전체 데이터가 3개의 부분집합으로 나누어진 셈이다 분류 와 회귀 두가지 모두 가능하다 의사결정 트리 분류 root node 가 A -> B, C로 분할, B가 -> C, D로 분할 * 이점을 고려하여 C,D,E 3개로 분할이 되는 특성을 ..

공부/AI School 인공지능 여름캠프

머신러닝 분류 Classification - [AI School]

Classification 분류 분류를 이해하기 Classification 특성과 알고리즘 분류의 다양한 방식을 알아보기 Logistic Regression SoftMax Naive Bayes SVM 분류이해하기 분류 : 카테고리에 분류하는 방식 // 선형회귀는 분류에 사용 될 수 없음 분류는 0 또는 1의 값만 가지기 때문에 그 범위 이상의 값을 가질 수 없음. ex) 종양 크기를 통해 암 유무를 확인할때 선형회귀를 사용한다 치면 종용의 크기 데이터 하나의 값이 지나치게 다를경우 중간에 분류할 값을 찾기 힘들어 분류에 오류가 생김 고로 다른 모델을 사용 해야함 https://wikidocs.net/4288 Logistic Regression 0~1 사이의 값만 보내는 함수가 필요 0

공부/AI School 인공지능 여름캠프

머신러닝 회귀(Regression) 정리 - [AI School]

회귀(Refression) 선형회귀 Linear Regression 개념 및 예제 학습 - [머신러닝] 선형회귀 머신러닝을 공부하며 선형회귀를 다들 귀에익을 정도로 들었을 것이다. 그래서 선형회귀가 뭔데? 선형회귀 어려운말로 회귀는 변수들 간의 함수관계를 분석 yoon1seok.tistory.com 지도 학습을 이해하기 Supervised 와 Unsupervised를 이해하기 회귀의 다양한 방식 알아보기 변수의 개수 Cost 함수 경사하강법 Regression 의 응용 Lasso Regression Ridge Regression Elastic Net Regression 지도학습 이해하기지도학습 특정 input 값에 정답(label)이 있는 데이터가 주어진다. Regression : 어떤 input 값을 ..

공부/AI School 인공지능 여름캠프

파이썬 사이킷 런(sklearn) 이용 - [AI School]

사이킷 런 학습 Cross Validation 이해 K-fold Stratified-fold 모델에서 Dateset을 나누는 이유 Cross Validation의 이해 Dataset?* Machine Learning 모델을 만들기 위해 필요한 데이터 모임 * Machine Learning을 통해 해석이 필요한 데이터 모임 Vision에서 MINST, CIFAR-10, ImageNet 데이터 셋을 자주사용 Dateset나누기 Train model 모델의 Hyper-Parameter을 올바르게 정해주어야 한다 lr, batch size 등등 Bias : 모델의 Training data에 대한 예측값과 실제값의 오차 Variance : 모델의 test data에 대한 예측값과 실제값의 오차 High Bias ..

공부/AI School 인공지능 여름캠프

탐색적 데이터 분석(EDA) 정리 - [AI School]

탐색적 데이터 분석(EDA) 목차 머신러닝 프로젝트 진행과정 데이터 수집 전처리 탐색적 데이터 분석 모델 선택 평가 및 적용 탐색적 데이터 분석(EDA) 통계치 분석 및 시각화 상관관계 분석 머신러닝 프로젝트 진행과정(Work Flow) 데이터 수집(Data collection) 데이터 프로젝트를 하기 위해선 데이터가 필요하다. 웹 크롤링 과같은 방법(웹에서 데이터를 수집) 이미 쌓여 있는 DB 나 DataFile에서 데이터를 불러서 사용 데이터 전처리(Data Preprocessing) 수집한 데이터에는 중복된 값 이나, 이상한 값이 들어가있는 경우가 있다 이런 데이터를 머신러닝 입력에 적합한 형태러 변환하는 단계가 전처리 새로운 속성도 만들 기 위해Ex) 집의 가격 예측 가로 세로 데이터로 면적을 구..

공부/AI School 인공지능 여름캠프

파이썬 데이터 분석을 위한 함수 정리(Numpy, Pandas, Matplotlib) - [AI School]

파이썬 데이터 다루기 함수 정리 Numpy Matplotlib Pandas Seaborn Numpy 수학식을 다루기 위한 기본식 np.zeros(), np.ones(), np.arange() Array연산은 기본적으로 동일한 matrix끼리 연산이 진행된다. 연산의 크기가 달라도 Broadcast란 기능으로 크기가 다른 array도 연산이 가능하다 Array인덱싱이 좀 많이 쓰일것 같다. 1차원은 간단하기 때문에 2차원일때 다루기로 하겠다. x행의 모든 요소를꺼낼땐 data[ x - 1 , : ] y열의 모든 요소를꺼낼땐 data[ : , y - 1 ] 통계함수 행렬연산들 다루기 import numpy as np import random as rm data1 = np.array([1,2,3,4,5]) d..

1Seok
'공부/AI School 인공지능 여름캠프' 카테고리의 글 목록 (2 Page)