Definition of Outliers이상치란 정상치 값과 크게 차이가 나는 값을 말한다. Types of Outliers종속변수에 따라univariate outliers(단변량) : 종속변수가 한 개multivariate outliers(다변량) : 한 개 이상 환경에 따라 : point outliers, contextual outliers, collective outliers +) univariable (단변수), multivariable (다변수) : 독립변수의 갯수에 따라 Most common causes of outliers on a data set입력오류, 측정오류, 의도적 생성, 샘플링 에러 등novelties : 에러로 인한 이상치가 아닌 자연적으로 생긴 이상치를 일컫는다. Things ..
An Introduction to Statistical Learining 책의 1,2장을 정리한 내용입니다. Ch.011.1 통계학습의 개요Supervised Learning(지도학습) input 값으로 output 값을 예측 ex) 예측, 분류, 추론예측 : 연속적, 양적인 output을 예측하는 것분류 : 범주형, 질적인 output을 예측하는 것Unsupervised Learning(비지도학습) input값 없음. output값을 이용하여 input자료의 상관관계, 구조 파악 ex)군집화 Ch.022.1 통계학습이란?통계학습이란 를 추정하는 일련의 기법들을 말한다. 은 와 독립적이며 2.1.1 f를 추정하는 이유?함수 를 추정하는 두 가지 주된 이유는 예측과 추론이다.예측 ex) 집값 예측추론 ex..
아래는 ISLR의 내용을 간단히 정리한 것입니다. 피드백은 언제나 환영합니다. 차원축소의 두가지 방법 PC(Principal Components) 주성분 PLS(Partial Least Squares) 부분최소제곱 차원축소 : 고차원의 설명변수를 변환(transform)하여 저차원으로 만드는 방법 PCR(Principal Components Regression) 회귀를 위한 차원축소 기법을 살펴보겠습니다. 절차 표준화 주성분 벡터 생성 주성분은 설명변수 x의 선형결합으로 이루어진다. (이때, M < p ) 최소제곱 모델 적합 차원축소의 아이디어는 기존의 최소제곱회귀식 $$\hat{y} = \beta_0+\beta_1x_1 + \cdots + \beta_px_p$$ 은 p+1 개의 회귀계수를 구해야하지만..