지은이 소개 = 5 감사의 글 = 6 기술 감수자 소개 = 7 옮긴이 소개 = 10 옮긴이의 말 = 11 들어가며 = 21 1장 R과 하둡 준비 = 35 R 설치 = 36 RStudio 설치 = 38 R 언어 특성의 이해 = 38 R 패키지 사용 = 39 데이터 작업 수행 = 39 커뮤니티 지원의 증가 = 40 R에서 데이터 모델링 수행 = 40 하둡 설치 = 42 여러 가지 하둡 모드의 이해 = 43 하둡 설치 단계 = 43 우분투 리눅스에 하둡 설치(단일 노드 클러스터) = 44 우분투 리눅스에 하둡 설치(멀티 노드 클러스터) = 47 우분투에 클라우데라 하둡 설치 = 48 하둡 기능의 이해 = 52 HDFS의 이해 = 52 HDFS의 특성 = 53 맵리듀스 = 53 HDFS와 맵리듀스 아키텍처 = 55 HDFS 아키텍처 = 55 HDFS 컴포넌트 = 55 맵리듀스 아키텍처 = 56 맵리듀스 컴포넌트 = 56 HDFS와 맵리듀스 아키텍처를 그림으로 이해 = 56 하둡 하위 프로젝트의 이해 = 57 요약 = 62 2장 하둡 맵리둡스 프로그램 작성 = 63 맵리듀스의 기본 이해 = 64 하둡 맵리듀스 소개 = 66 하둡 맵리듀스 개체 나열 = 67 하둡 맵리듀스 시나리오 = 67 HDFS로 데이터 로딩 = 68 맵 단계 수행 = 68 셔플링과 정렬 = 69 리듀스 단계 수행 = 70 맵리듀스의 제약 = 71 문제 해결을 위해 하둡의 능력 = 71 하둡 프로그래밍에서 사용되는 여러 가지 자바 컨셉 = 72 하둡 맵리듀스의 기초 = 73 맵리듀스 객체의 이해 = 73 맵리듀스에서 맵의 개수 결정 = 74 맵리듀스에서 리듀서의 개수 결정 = 75 맵리듀스의 데이터 흐름 = 75 하둡 맵리듀스에서 사용하는 용어 = 77 하둡 맵리듀스 예제 작성 = 80 맵리듀스 잡 수행 과정 = 81 하둡 맵리듀스 잡을 모니터링하고 디버깅하는 방법 = 86 HDFS 데이터 살펴보기 = 87 비즈니스 문제를 해결하는 여러 가지 맵리듀스 정의 = 88 R에서 하둡 맵리듀스를 작성하는 다양한 방법 소개 = 89 RHadoop 소개 = 90 RHIPE 소개 = 91 하둡 스트리밍 소개 = 91 요약 = 92 3장 R과 하둡 연동 = 93 RHIPE 소개 = 94 RHIPE 설치 = 95 하둡 설치 = 96 R 설치 = 96 프로토콜 버퍼 설치 = 96 환경변수 = 97 rJava 패키지 설치 = 97 RHIPE 설치 = 98 RHIPE 아키텍처의 이해 = 98 RHIPE 예제 살펴보기 = 99 RHIPE 예제 프로그램(단일 맵 프로그램) = 99 단어 수 세기 = 101 RHIPE 함수의 레퍼런스 = 103 초기화 = 103 HDFS = 104 맵리듀스 = 105 RHadoop 소개 = 106 RHadoop 아키텍처의 이해 = 107 RHadoop 설치 = 107 RHadoop 예제 살펴보기 = 110 단어 수 세기 = 111 RHadoop 함수의 레퍼런스 = 113 hdfs 패키지 = 113 rmr 패키지 = 116 요약 = 116 4장 R로 하둡 스트리밍 사용 = 117 하둡 스트리밍의 기본 이해 = 117 R로 하둡 스트리밍을 수행하는 방법 = 122 맵리듀스 애플리케이션의 이해 = 122 맵리듀스 애플리케이션 작성 방법 = 124 맵리듀스 애플리케이션 실행 방법 = 128 명령 프롬프트에서 하둡 스트리밍 잡 실행 = 128 R 또는 RStudio에서 하둡 스트리밍 잡 실행 = 129 맵리듀스 애플리케이션의 결과를 살펴보는 방법 = 129 명령 프롬프트에서 결과 살펴보기 = 129 R 또는 RStudio 콘솔에서 결과 살펴보기 = 130 하둡 맵리듀스 스크립트에서 사용된 기본 R 함수의 이해 = 131 하둡 맵리듀스 잡 모니터링 = 132 R 패키지 HadoopStreaming 살펴보기 = 134 hsTableReader 함수 = 134 hsKeyValReader 함수 = 137 hsLineReader 함수 = 137 하둡 스트리밍 잡 수행 = 141 하둡 스트리밍 잡 실행 = 142 요약 = 142 5장 R과 하둡으로 데이터 분석 = 143 데이터 분석 프로젝트의 라이프 사이클 이해 = 143 문제 확인 = 144 데이터 요구사항 디자인 = 145 데이터 전처리 = 145 데이터 분석 수행 = 145 데이터 시각화 = 146 데이터 분석 문제의 이해 = 148 웹 페이지의 카테고리 분석 = 148 문제 확인 = 149 데이터 요구사항 디자인 = 149 데이터 전처리 = 151 데이터 분석 수행 = 151 데이터 시각화 = 158 주식 시장 변화의 빈도 계산 = 159 문제 확인 = 159 데이터 요구사항 디자인 = 159 데이터 전처리 = 160 데이터 분석 수행 = 160 데이터 시각화 = 165 불도저를 위한 시험 답안지의 판매 가격 예측 = 167 문제 확인 = 167 데이터 요구사항 디자인 = 168 데이터 전처리 = 169 데이터 분석 수행 = 171 포아송 근사 재표본화의 이해 = 172 RHadoop을 이용한 랜덤 포레스트 학습 = 174 요약 = 178 6장 기계학습을 이용한 빅데이터 분석 = 179 기계학습 소개 = 180 기계학습 알고리즘의 유형 = 180 감독 학습 알고리즘 = 181 선형 회귀 = 181 R을 이용한 선형 회귀 = 183 R과 하둡을 이용한 선형 회귀 = 184 로지스틱 회귀 = 188 R을 이용한 로지스틱 회귀 = 189 R과 하둡을 이용한 로지스틱 회귀 = 189 무감독 기계학습 알고리즘 = 192 군집화 = 192 R을 이용한 군집화 = 193 R과 하둡을 이용한 군집화 수행 = 194 추천 알고리즘 = 198 R에서의 추천 생성 과정 = 200 R과 하둡으로 추천 생성 = 204 요약 = 208 7장 다양한 DB에서 데이터 가져오기와 내보내기 = 209 데이터 파일을 데이터베이스로 사용 = 211 다양한 형태의 파일 이해 = 212 R 패키지 설치 = 212 R로 데이터 가져오기 = 212 R에서 데이터 내보내기 = 213 MySQL 사용 = 214 MySQL 설치 = 214 RMySQL 설치 = 215 테이블과 테이블의 구조 알아보기 = 215 R로 데이터 가져오기 = 215 데이터 조작 살펴보기 = 216 엑셀 사용 = 217 엑셀 관련 패키지 설치 = 217 R로 데이터 가져오기 = 218 R과 엑셀로 데이터 가공 = 218 데이터를 엑셀로 내보내기 = 218 MongoDB 사용 = 218 MongoDB 설치 = 219 SQL과 MongoDB 용어 매핑 = 221 SQL과 MongoQL 용어 매핑 = 221 rmongodb 설치 = 222 R로 데이터 가져오기 = 222 데이터 조작 살펴보기 = 223 SQLite 사용 = 224 SQLite의 기능 이해 = 224 SQLite 설치 = 225 RSQLite 설치 = 225 R로 데이터 가져오기 = 225 데이터 조작 살펴보기 = 226 PostgreSQL 사용 = 226 PostgreSQL의 기능 이해 = 226 PostgreSQL 설치 = 227 RPostgreSQL 설치 = 227 R에서 데이터 내보내기 = 228 하이브 사용 = 229 하이브의 기능 이해 = 229 하이브 설치 = 230 하이브 설정 세팅 = 230 RHive 설치 = 231 RHive 작업 살펴보기 = 231 HBase 사용 = 232 HBase의 기능 이해 = 233 HBase 설치 = 233 쓰리프트 설치 = 235 RHBase 설치 = 236 R에서 데이터 가져오기 = 236 데이터 조작 살펴보기 = 237 요약 = 237 부록 : 참고자료 = 239 R+하둡 도움말 문서 = 239 R 그룹 = 241 하둡 그룹 = 242 R+하둡 그룹 = 242 인기 있는 R 컨트리뷰터 = 243 인기 있는 하둡 컨트리뷰터 = 244 찾아보기 = 246