try 기본 flask파일을 실행하려함 $ python run.py Problem 분명 터미널에 파일이 위치하고있는데 못 찾음 FileNotFoundError:[Errno 2] No such file or directory: '/mnt/hgfs/jinie/flask_base/run.py Solved 방법1. app.run(debug=True) 를 False로 바꾸면 된다. 방법2. 디버그를 쓰려면 파일 실행시 $ python -m 파일명 하면 실행잘됨 관련 포스팅은 여기
Problem pip upgrade하던 도중 문제 발생 AttributeError: 'module' object has no attribute 'SSL_ST_INIT' Solved python 버전이 2.7과 3.5 두가지였다. default를 3.5로 변경 1. $ nano ~/.bashrc 2. type alias python=python3 alias pip=pip3 alias sudo='sudo' 3. source ~/.bashrcCheck $ python --version 전엔 2.7이 나왔는데 이젠 3.5로 나온다 Result $ pip install --upgrade pip Successfully installed pip-19.1.1
빅데이터를 지탱하는 기술(저자 니시다 케이스케) 책 chapter1. 요약 1. 분산 시스템에 의한 데이터 처리의 고속화 Hadoop, NoSQL 출현 기존 RDB(관계형데이터베이스) 에 담을 수 없을만큼 많은 데이터가 발생 NoSQL 데이터베이스에 기록하고 Hadoop으로 분산 처리하기 Hadoop : 다수의 컴퓨터에서 대량의 데이터 처리 java를 사용하여 MapReduce 동작 SQL언어로 Hadoop을 사용하기위해 Hive 출현 NoSQL : 빈번한 읽기/쓰기 및 분산 처리가 강점 document store : JSON과 같이 복잡한 데이터 구조를 저장. ex) MongoDB key-value store : 다수의 키와 값을 관련지어 저장 ex) Redis 2. 빅데이터의 기술 data pipel..
Definition of Outliers이상치란 정상치 값과 크게 차이가 나는 값을 말한다. Types of Outliers종속변수에 따라univariate outliers(단변량) : 종속변수가 한 개multivariate outliers(다변량) : 한 개 이상 환경에 따라 : point outliers, contextual outliers, collective outliers +) univariable (단변수), multivariable (다변수) : 독립변수의 갯수에 따라 Most common causes of outliers on a data set입력오류, 측정오류, 의도적 생성, 샘플링 에러 등novelties : 에러로 인한 이상치가 아닌 자연적으로 생긴 이상치를 일컫는다. Things ..
Visual Studio Code 실행 단축키 설정법 1. Ctrl+Shift+b 누른다 그럼 창위에 Create ... 라고 뜬다. 클릭 2. Others 클릭 3. 아래 내용 붙여넣기 1234567891011121314151617181920{ // See https://go.microsoft.com/fwlink/?LinkId=733558 // for the documentation about the tasks.json format "version": "2.0.0", "tasks": [ { "label": "파이썬 구동", "type": "shell", "command": "python", "args": [ "${file}" ], "group": { "kind": "build", "isDefault":..
내가 공부하려고 적는, 문자열이 있는 데이터프레임 처리하기 process (기존)데이터 필드 타입 살펴보기data frame : numeric(38개 열) + categorical (3개 열)label : categorical (5개의 값) df.shape (4898431, 42) null 값 보기 다행히 null값 없음 train_test_splitfrom sklearn.model_selection import train_test_splitx_train, x_test, y_train, y_test = train_test_split(df.drop('label', 1), df['label']) convert string to intxfrom sklearn.preprocessing import LabelE..