목차
지은이 소개 = 4
기술 감수자 소개 = 5
옮긴이 소개 = 6
옮긴이의 말 = 7
들어가며 = 15
1장 데이터 분석 개론 = 23
  데이터 분석의 기원 = 24
  과학적 방법 = 24
  보험학 = 26
  증기로 계산 = 26
  멋진 예시 = 27
  허먼 홀러리스 = 29
  에니악 = 30
  비지칼크 = 31
  데이터, 정보, 지식 = 32
  왜 자바인가? = 32
  자바 통합 개발 환경 = 33
  요약 = 35
2장 데이터 처리 = 37
  데이터 유형 = 37
  변수 = 38
  데이터 포인트와 데이터 셋 = 39
    널 값 = 40
  관계형 데이터베이스 테이블 = 40
    키 필드 = 41
    키-값 쌍 = 41
  해시 테이블 = 42
  파일 형식 = 44
    마이크로소프트 엑셀 데이터 = 47
    XML과 JSON 데이터 = 51
  테스트 데이터 셋 생성 = 59
    메타데이터 = 61
    데이터 클리닝 = 61
    데이터 스케일링 = 62
    데이터 필터링 = 64
    정렬 = 67
    병합 = 69
    해싱 = 72
  요약 = 74
3장 데이터 시각화 = 75
  테이블과 그래프 = 76
    산점도 = 77
    선그래프 = 78
    막대그래프 = 80
    히스토그램 = 81
  시계열 데이터 = 82
  자바 구현체 = 84
  이동 평균 = 88
  데이터 순위 = 93
  도수 분포 = 96
  정규 분포 = 98
    사고 실험 = 98
  지수 분포 = 101
  자바 예제 = 102
  요약 = 103
4장 통계 = 105
  기술 통계 = 105
  임의 추출 = 109
  확률 변수 = 112
  확률 분포 = 113
  누적 분포 = 115
  이항 분포 = 117
  다변량 분포 = 122
  조건부 확률 = 125
  확률적 이벤트의 독립 = 126
  분할표 = 127
  베이즈 정리 = 128
  상관계수와 공분산 = 130
  표준 정규 분포 = 132
  중심 극한 정리 = 138
  신뢰 구간 = 140
  가설 검정 = 142
  요약 = 145
5장 관계형 데이터베이스 = 147
  관계 데이터 모델 = 148
  관계형 데이터베이스 = 149
  외래키 = 150
  관계형 데이터베이스 디자인 = 151
    데이터베이스 생성 = 153
    SQL 명령문 = 158
    데이터베이스에 데이터 입력 = 164
    데이터베이스 쿼리 = 167
    SQL 데이터 유형 = 168
    JDBC = 169
    JDBC의 PreparedStatement 사용하기 = 172
    배치 처리 = 175
    데이터베이스 뷰 = 179
    서브쿼리 = 183
    테이블 인덱스 = 186
  요약 = 189
6장 회귀 분석 = 191
  선형 회귀 = 191
    엑셀에서의 선형 회귀 = 192
    회귀 상관계수 계산 = 198
    분산 분석 = 201
    선형 회귀 자바 구현 = 206
    앤스콤 쿼텟 = 215
  다항식 회귀 = 217
    다중선형회귀분석 = 224
    아파치 커먼즈 구현 = 228
    곡선 적합 = 229
  요약 = 231
7장 분류 분석 = 233
  의사 결정 트리 = 235
    의사결정 트리와 엔트로피와의 관계 = 236
    ID3 알고리즘 = 241
  웨카 플랫폼 = 257
    ARFF 파일 유형 = 257
    웨카를 사용한 자바 구현 = 260
  베이지안 분류기 = 262
    웨카를 사용한 자바 구현 = 265
    서포트 벡터 머신 알고리즘 = 268
  로지스틱 회귀 = 273
    K-최근접 이웃 알고리즘 = 280
    퍼지 분류 알고리즘 = 285
  요약 = 286
8장 클러스터 분석 = 287
  거리 측정 = 287
  차원의 저주 = 294
  계층적 클러스터링 = 296
    웨카 구현 = 306
    K-평균 클러스터링 = 309
    K-중간점 클러스터링 = 315
    유사성 전파 클러스터링 = 318
  요약 = 327
9장 추천 시스템 = 329
  유틸리티 행렬 = 330
  유사도 측정 = 332
  코사인 유사도 = 334
  간단한 추천 시스템 = 335
  아마존 아이템 기반 협업 필터링 = 347
  사용자 등급 구현 = 354
  거대 희소 행렬 = 359
  임의 접근 파일 사용 = 363
  넷플릭스 대회 = 367
  요약 = 368
10장 NoSQL 데이터베이스 = 369
  맵 데이터 구조 = 370
  SQL과 NoSQL = 373
  몽고 데이터베이스 시스템 = 375
  도서관 데이터베이스 = 383
  몽고DB를 사용한 자바 개발 = 386
  지리 정보 데이터베이스를 위한 몽고DB 확장 = 395
  몽고DB에서의 인덱스 = 397
  왜 NoSQL인가? 왜 몽고DB인가? = 399
  타 NoSQL 데이터베이스 시스템 = 399
  요약 = 400
11장 빅데이터 분석 = 401
  확장, 데이터 스트라이핑, 샤딩 = 402
  구글 페이지랭크 알고리즘 = 403
  구글 맵 리듀스 프레임워크 = 409
  맵 리듀스 애플리케이션 예제 = 410
  워드카운트 예제 = 411
  확장성 = 416
  맵 리듀스를 사용한 행렬 곱 = 419
  몽고DB에서의 맵 리듀스 = 424
  아파치 하둡 = 425
  하둡 맵리듀스 = 426
  요약 = 428
부록 : 자바 도구 = 429
  명령창 = 429
  자바 = 430
  이클립스 = 432
  MySQL = 438
  MySQL 워크벤치 = 446
  이클립스에서 MySQL 데이터베이스 접근 = 455
  몽고DB = 464
찾아보기 = 471
닫기