목차
추천의 글 = 7
지은이 소개 = 9
기술 감수자 소개 = 11
옮긴이 소개 = 13
옮긴이의 글 = 14
들어가며 = 34
1장 머신 러닝의 개요 = 45
  머신 러닝의 역사와 정의 = 48
  머신 러닝에 대한 오해 : 머신 러닝이 아닌 것은? = 50
  머신 러닝의 핵심 개념과 주요 용어 = 50
  머신 러닝에 활용되는 다양한 데이터 타입과 서브타입 = 55
  머신 러닝에 활용되는 데이터세트 = 60
  산업 부문별 머신 러닝 응용 분야와 알고리즘 = 63
  머신 러닝의 실무적인 과제 = 64
  머신 러닝 전문가와 구현 프로세스 = 67
    머신 러닝 전문가 = 67
    머신 러닝 프로세스 = 67
  머신 러닝 도구와 데이터세트 = 71
    머신 러닝 데이터세트 = 75
  정리 = 76
2장 지도학습에 대한 실무적인 접근 = 79
  지도학습에 사용되는 용어와 표기법 = 81
    데이터 품질 분석 = 82
    기술적(설명적) 데이터 분석 = 83
    시각화 분석 = 84
  데이터 변환 및 전처리 = 86
    추가적인 특성 = 86
    누락값 처리 = 87
    이상점 = 89
    이산화 = 91
    데이터 표본추출 = 92
    모델 훈련, 검증, 그리고 테스트 데이터세트 = 94
  특성 관계 분석과 차원 감소 = 99
    특성 검색 기술 = 100
    특성 평가 기법 = 100
    랩퍼 기법 = 105
    임베드 접근법 = 106
  모델 만들기 = 106
    선형 모델 = 107
    비선형 모델 = 112
    앙상블 학습과 메타학습 모델 = 121
  모델 평가, 검증, 비교 = 125
    모델 평가 = 126
    모델 검증 매트릭스 = 127
    머신 러닝 모델 간의 비교 = 131
  사례 연구 - 말의 복통 분류 = 135
    비즈니스 문제 정의 = 137
    머신 러닝 맵핑 = 137
    데이터 분석 = 137
    지도학습 실험 = 139
    결과, 관찰, 그리고 분석 = 153
  정리 = 155
3장 비지도식 머신 러닝 기법 = 161
  지도식 머신 러닝 기법의 주요 이슈 = 162
  비지도식 머신 러닝 기법의 주요 이슈 = 163
  특성 분석과 차원 감소 = 164
    표기법 = 164
    선형 차원 감소 기법 = 165
    비선형 차원 감소 기법 = 170
  클러스터링 = 174
    클러스터링 알고리즘 = 174
    스펙트럴 클러스터링 = 185
    어피니티 전파 = 186
    클러스터링 검증 및 평가 = 189
  이상점 또는 특이점 감지 기법 = 193
    이상점 감지 알고리즘 = 193
    이상점 평가 기법 = 206
  실무 사례 분석 = 208
    도구와 소프트웨어 = 208
    비즈니스 문제 정의 = 208
    머신 러닝 맵핑 = 209
    데이터 수집 = 209
    데이터 품질 분석 = 210
    데이터 샘플링 및 변환 = 211
    특성 분석 및 차원 감소 = 211
    클러스터링 모델, 결과, 그리고 평가 = 217
    이상점 모델 구현 결과 및 평가 = 221
  정리 = 223
4장 반지도 학습 및 능동 학습 = 229
  반지도 학습 = 231
    기본적인 수식 및 표현, 가정 = 232
    반지도 학습 기법 = 234
    반지도 학습 실무 사례 분석 = 243
  능동 학습 = 251
    기본 표현과 수식 = 252
    능동 학습 시나리오 = 253
    능동 학습 절차 = 253
    버전 공간 표본추출 = 256
    데이터 분포 표본추출 = 258
  능동 학습 실무 사례 분석 = 260
    도구와 소프트웨어 = 261
    비즈니스 문제 정의 = 261
    머신 러닝 맵핑 = 261
    데이터 수집 = 261
    데이터 샘플링 및 변환 = 262
    특성 분석 및 차원 감소 = 262
    모델, 결과, 평가 = 263
    능동 학습 결과 분석 = 268
  정리 = 269
5장 실시간 스트림 머신 러닝 = 273
  스트림 기반 학습의 기본 가정 및 수학적 표현 = 275
  기본 스트림 처리 및 연산 기법 = 276
    스트림 연산 = 276
    슬라이딩 윈도우 = 278
    표본추출 = 279
  컨셉 드리프트와 드리프트 감지 = 280
    데이터 관리 기법 = 282
    감지 기법 = 283
  증가형 지도 학습 = 286
    모델 구현 방법 = 287
    온라인 설정에서의 모델 검증, 평가, 비교 = 297
  클러스터링을 활용한 증가형 비지도 학습 = 301
    모델 구현 기법 = 301
  이상점 감지를 위한 비지도 학습 = 318
    이상점 감지를 위한 파티션 기반 클러스터링 = 319
    이상점 감지를 위한 거리 기반 클러스터링 = 320
  스트림 기반 학습의 실무 사례 = 325
    도구 및 소프트웨어 = 326
    비즈니스 문제 정의 = 328
    머신 러닝 맵핑 = 329
    데이터 수집 = 329
    표본추출 및 변환 = 329
    모델, 결과, 평가 = 331
    스트림 기반 학습 결과 분석 = 338
  정리 = 340
6장 확률적 그래프 모델 구현 = 345
  확률 복습 = 346
    확률의 개념 = 346
  그래프의 개념 = 352
    그래프 구조 및 기본 속성 = 352
    서브그래프와 클리닉 = 353
    패스, 트레일, 사이클 = 354
    베이지안 네트워크 = 354
    수학적 표현 = 356
    추론 = 360
    베이지안 네트워크에서의 학습 = 375
    학습 파라미터 = 377
  마코프 네트워크와 조건부 랜덤 필드 = 387
    수학적 표현 = 388
    마코프 네트워크에서의 추론 = 391
    마코프 네트워크에서의 학습 = 392
    조건부 랜덤 필드 = 393
  특화된 네트워크 = 394
    트리 강화 네트워크 = 394
    마코프 체인 = 395
    HMM의 최고 확률 경로 = 398
    HMM의 사후 복호화 = 399
  도구와 활용 방법 = 400
    오픈마코프 = 401
    Weka 베이지안 네트워크 GUI = 403
  실무 사례 분석 = 405
    비즈니스 문제 정의 = 405
    머신 러닝 맵핑 = 405
    표본추출 및 데이터 변환 = 405
    특성 분석 = 406
    모델, 결과, 평가 = 407
    결과 분석 = 410
  정리 = 411
7장 딥러닝 = 415
  다층 피드포워드 신경망 기법 = 416
    입력값, 뉴론, 활성화 함수, 수학적 표현 = 416
    다층 신경망 = 417
  신경망 기법의 한계 = 427
    기울기 사라짐, 지역 최적화, 훈련 지연 문제 = 427
  딥러닝 = 429
    딥러닝의 주요 개념 = 430
  사례 분석 = 468
    도구와 소프트웨어 = 469
    비즈니스 문제 = 469
    머신 러닝 맵핑 = 470
    표본추출 및 데이터 = 470
    특성 분석 = 470
    모델, 결과, 평가 = 470
  정리 = 484
8장 텍스트 마이닝과 자연어 처리 = 491
  NLP, 하위 분야 및 주요 임무 = 493
    텍스트 범주화 = 494
  음성 태깅 = 495
    텍스트 클러스터링 = 495
    정보 추출 및 개체명 인식 = 496
    감정 분석 및 오피니언 마이닝 = 496
    대용어 또는 동일지시어 해소 = 497
    어휘 중의성 해소 = 497
    기계 번역 = 498
    시멘틱(의미론적) 논증 및 추론 = 498
    텍스트 자동 요약 = 498
    자동화된 질문과 답변 = 499
  비정형 데이터 마이닝의 당면 과제 = 499
  텍스트 처리 요소와 변환 = 500
    문서 수집 및 표준화 = 501
    토큰화 = 502
    중지 단어 제거 = 503
    어간 단어 표기 = 504
    지역 및 전역 사전 생성 = 505
    특성 추출 및 생성 = 506
    특성의 대표성 및 유사성 = 510
    특성 선택 및 차원 감소 기법 = 515
  텍스트 마이닝에서의 토픽 선정 = 518
    텍스트 카테고리화 및 텍스트 분류 = 518
    토픽 모델링 = 519
    텍스트 클러스터링 = 524
    클러스터링 기법 = 524
  개체명 인식 = 531
    NER을 위한 은닉 마코프 모델 = 532
    딥러닝과 NLP = 536
  NLP 분석 도구와 활용 방법 = 542
    맬릿을 이용한 토픽 모델링 = 544
    비즈니스 문제 정의 = 545
    머신 러닝 맵핑 = 546
    데이터 수집 = 546
    표본추출 및 변환 = 546
    특성 분석 및 차원 감소 = 548
    모델, 결과, 평가 = 549
    텍스트 처리 결과 분석 = 550
  정리 = 551
9장 빅데이터 분석을 위한 머신 러닝의 첨단 도구 = 557
  빅데이터의 특징 = 560
  빅데이터 분석을 위한 머신 러닝 = 561
    범용 빅데이터 프레임워크 = 561
  배치형 빅데이터 머신 러닝 = 573
    빅데이터 머신 러닝 플랫폼 - H2O = 574
  사례 분석 = 582
    비즈니스 문제 정의 = 582
    머신 러닝 맵핑 = 583
    데이터 수집 = 583
    데이터 추출 및 변환 = 583
    빅데이터 머신 러닝 플랫폼 - Spark MLlib = 586
  실시간형 빅데이터 머신 러닝 = 598
    실시간 빅데이터 머신 러닝 프레임워크 - SAMOA = 599
    머신 러닝 알고리즘 = 602
    도구와 활용 = 603
    실험, 결과, 그리고 분석 = 604
  머신 러닝의 미래 = 605
  정리 = 606
부록 A 선형 대수학 = 611
  벡터 = 612
    벡터의 스칼라 곱 = 612
  행렬 = 612
    행렬 변환 = 613
  행렬의 특이값 분해 = 617
부록 B 확률 = 619
  확률의 공리 = 619
  베이즈 이론 = 620
    확률 밀도 측정 = 620
    평균 = 621
    분산 = 621
    표준편차 = 622
    가우시안 표준편차 = 622
    공분산 = 623
    상관관계 상관계수 = 623
    이항 분포 = 624
    푸와송 분포 = 624
    가우시안 분포 = 625
    중심극한정리 = 625
    오류 전파 = 626
찾아보기 = 628
닫기