빅데이터 기초지식
빅데이터를 지탱하는 기술(저자 니시다 케이스케) 책 chapter1. 요약 1. 분산 시스템에 의한 데이터 처리의 고속화 Hadoop, NoSQL 출현 기존 RDB(관계형데이터베이스) 에 담을 수 없을만큼 많은 데이터가 발생 NoSQL 데이터베이스에 기록하고 Hadoop으로 분산 처리하기 Hadoop : 다수의 컴퓨터에서 대량의 데이터 처리 java를 사용하여 MapReduce 동작 SQL언어로 Hadoop을 사용하기위해 Hive 출현 NoSQL : 빈번한 읽기/쓰기 및 분산 처리가 강점 document store : JSON과 같이 복잡한 데이터 구조를 저장. ex) MongoDB key-value store : 다수의 키와 값을 관련지어 저장 ex) Redis 2. 빅데이터의 기술 data pipel..
분산처리시스템
2019. 5. 19. 16:12