from IPython.core.display import display, HTMLdisplay(HTML(""))정규표현식 (Regular Expressions)목적 : 데이터 전처리 과정에서 데이터를 정제, 일반 전처리복잡한 문자열을 처리할 때 사용응용 : 한글제거, 한자제거, 숫자제거, 알파벳제거, 공백제거 등등..전방탐색(긍정/부정) 수행코드 re.compile() 로 패턴객체 생성 방법1 p = re.compile(정규식) m = p.match( 문자 )방법2 m = re.match( 정규식, 문자 ) methodmethod설명returnmatch()문자열의 처음부터 정규식에 매치되는지 조사, 1개만찾음매치하면 match객체 매치하지않으면 None을 리턴search()문자열의 전체. 정규식에 매치..
파이프라인에 대해서 알아봅시다! 사용할 데이터셋은 다음과 같습니다. load_breast_cancer 사이킷런에서 제공하는 이진분류데이터셋으로 y는 0과 1입니다Classes2Samples per class212(M),357(B)Samples total569Dimensionality30Featuresreal, positive최솟값, 최댓값을 찾아 데이터의 스케일을 바꾸고 SVM을 훈련시켜 평가해보겠습니다from sklearn.pipeline import Pipeline, make_pipelinefrom sklearn.datasets import load_breast_cancerfrom sklearn.model_selection import train_test_splitfrom sklearn.preproc..