지은이 소개 = 4 기술 감수자 소개 = 5 옮긴이 소개 = 6 옮긴이의 말 = 7 들어가며 = 15 1장 데이터 분석 개론 = 23 데이터 분석의 기원 = 24 과학적 방법 = 24 보험학 = 26 증기로 계산 = 26 멋진 예시 = 27 허먼 홀러리스 = 29 에니악 = 30 비지칼크 = 31 데이터, 정보, 지식 = 32 왜 자바인가? = 32 자바 통합 개발 환경 = 33 요약 = 35 2장 데이터 처리 = 37 데이터 유형 = 37 변수 = 38 데이터 포인트와 데이터 셋 = 39 널 값 = 40 관계형 데이터베이스 테이블 = 40 키 필드 = 41 키-값 쌍 = 41 해시 테이블 = 42 파일 형식 = 44 마이크로소프트 엑셀 데이터 = 47 XML과 JSON 데이터 = 51 테스트 데이터 셋 생성 = 59 메타데이터 = 61 데이터 클리닝 = 61 데이터 스케일링 = 62 데이터 필터링 = 64 정렬 = 67 병합 = 69 해싱 = 72 요약 = 74 3장 데이터 시각화 = 75 테이블과 그래프 = 76 산점도 = 77 선그래프 = 78 막대그래프 = 80 히스토그램 = 81 시계열 데이터 = 82 자바 구현체 = 84 이동 평균 = 88 데이터 순위 = 93 도수 분포 = 96 정규 분포 = 98 사고 실험 = 98 지수 분포 = 101 자바 예제 = 102 요약 = 103 4장 통계 = 105 기술 통계 = 105 임의 추출 = 109 확률 변수 = 112 확률 분포 = 113 누적 분포 = 115 이항 분포 = 117 다변량 분포 = 122 조건부 확률 = 125 확률적 이벤트의 독립 = 126 분할표 = 127 베이즈 정리 = 128 상관계수와 공분산 = 130 표준 정규 분포 = 132 중심 극한 정리 = 138 신뢰 구간 = 140 가설 검정 = 142 요약 = 145 5장 관계형 데이터베이스 = 147 관계 데이터 모델 = 148 관계형 데이터베이스 = 149 외래키 = 150 관계형 데이터베이스 디자인 = 151 데이터베이스 생성 = 153 SQL 명령문 = 158 데이터베이스에 데이터 입력 = 164 데이터베이스 쿼리 = 167 SQL 데이터 유형 = 168 JDBC = 169 JDBC의 PreparedStatement 사용하기 = 172 배치 처리 = 175 데이터베이스 뷰 = 179 서브쿼리 = 183 테이블 인덱스 = 186 요약 = 189 6장 회귀 분석 = 191 선형 회귀 = 191 엑셀에서의 선형 회귀 = 192 회귀 상관계수 계산 = 198 분산 분석 = 201 선형 회귀 자바 구현 = 206 앤스콤 쿼텟 = 215 다항식 회귀 = 217 다중선형회귀분석 = 224 아파치 커먼즈 구현 = 228 곡선 적합 = 229 요약 = 231 7장 분류 분석 = 233 의사 결정 트리 = 235 의사결정 트리와 엔트로피와의 관계 = 236 ID3 알고리즘 = 241 웨카 플랫폼 = 257 ARFF 파일 유형 = 257 웨카를 사용한 자바 구현 = 260 베이지안 분류기 = 262 웨카를 사용한 자바 구현 = 265 서포트 벡터 머신 알고리즘 = 268 로지스틱 회귀 = 273 K-최근접 이웃 알고리즘 = 280 퍼지 분류 알고리즘 = 285 요약 = 286 8장 클러스터 분석 = 287 거리 측정 = 287 차원의 저주 = 294 계층적 클러스터링 = 296 웨카 구현 = 306 K-평균 클러스터링 = 309 K-중간점 클러스터링 = 315 유사성 전파 클러스터링 = 318 요약 = 327 9장 추천 시스템 = 329 유틸리티 행렬 = 330 유사도 측정 = 332 코사인 유사도 = 334 간단한 추천 시스템 = 335 아마존 아이템 기반 협업 필터링 = 347 사용자 등급 구현 = 354 거대 희소 행렬 = 359 임의 접근 파일 사용 = 363 넷플릭스 대회 = 367 요약 = 368 10장 NoSQL 데이터베이스 = 369 맵 데이터 구조 = 370 SQL과 NoSQL = 373 몽고 데이터베이스 시스템 = 375 도서관 데이터베이스 = 383 몽고DB를 사용한 자바 개발 = 386 지리 정보 데이터베이스를 위한 몽고DB 확장 = 395 몽고DB에서의 인덱스 = 397 왜 NoSQL인가? 왜 몽고DB인가? = 399 타 NoSQL 데이터베이스 시스템 = 399 요약 = 400 11장 빅데이터 분석 = 401 확장, 데이터 스트라이핑, 샤딩 = 402 구글 페이지랭크 알고리즘 = 403 구글 맵 리듀스 프레임워크 = 409 맵 리듀스 애플리케이션 예제 = 410 워드카운트 예제 = 411 확장성 = 416 맵 리듀스를 사용한 행렬 곱 = 419 몽고DB에서의 맵 리듀스 = 424 아파치 하둡 = 425 하둡 맵리듀스 = 426 요약 = 428 부록 : 자바 도구 = 429 명령창 = 429 자바 = 430 이클립스 = 432 MySQL = 438 MySQL 워크벤치 = 446 이클립스에서 MySQL 데이터베이스 접근 = 455 몽고DB = 464 찾아보기 = 471