목차
1장 데이터마이닝 개요 ... 13
   1.1 데이터마이닝의 기능과 기법 ... 15
   1.2 데이터마이닝의 활용 분야 ... 17
   1.3 참고사항 ... 19
1부 예측
   2장 회귀분석 ... 21
      2.1 다중회귀모형 ... 23
      2.2 회귀계수의 추정 ... 25
      2.3 모형에 따른 추론 ... 32
        2.3.1 회귀성 검정 ... 32
        2.3.2 개별 회귀계수에 대한 검정(t-검정) ... 37
      2.4 변수선택 방법 ... 42
        2.4.1 모형의 성능척도 ... 42
        2.4.2 모든 가능한 조합의 회귀분석 ... 44
        2.4.3 단계적 변수선택 ... 46
      2.5 회귀모형의 진단 ... 52
      2.6 반응치에 대한 추정 및 예측 ... 56
        2.6.1 평균반응치의 추정 ... 56
        2.6.2 미래반응치의 예측 ... 59
        2.6.3 예측성능 평가 ... 60
      2.7 다중공선성 ... 62
        2.7.1 다중공선성의 진단 방법 및 척도 ... 63
        2.7.2 다중공선성의 해결 방법 ... 65
      2.8 지시변수와 회귀모형 ... 68
      2.9 참고사항 ... 75
      연습문제 ... 77
   3장 주성분분석 ... 97
      3.1 변수의 변동과 제곱합 ... 99
      3.2 주성분의 이해 ... 102
      3.3 행렬의 분해 ... 105
      3.4 주성분 스코어 ... 114
      3.5 제곱합 분해 ... 117
      3.6 NIPALS 알고리즘 ... 123
      3.7 주성분 회귀분석 ... 125
        3.7.1 회귀계수의 추정 ... 126
        3.7.2 개별 회귀계수의 검정 ... 127
        3.7.3 회귀성 검정 ... 128
        3.7.4 반응치의 예측 ... 132
      3.8 참고사항 ... 133
      연습문제 ... 134
   4장 부분최소자승 회귀분석 ... 141
      4.1 하나의 종속변수에 대한 PLS 회귀분석 ... 143
        4.1.1 NIPALS 알고리즘 ... 144
        4.1.2 제곱합 분해 ... 150
        4.1.3 새로운 데이터에 대한 종속변수 예측 ... 152
        4.1.4 독립변수의 중요도 ... 155
      4.2 다수의 종속변수에 대한 PLS 회귀분석 ... 158
        4.2.1 NIPALS 알고리즘 ... 160
        4.2.2 제곱합 분해 ... 164
        4.2.3 새로운 데이터에 대한 종속변수 예측 ... 168
      4.3 예측성능 평가 ... 171
      4.4 참고사항 ... 171
      연습문제 ... 173
2부 분류분석
   5장 분류분석 개요 ... 179
      5.1 분류문제 및 분류기법 ... 181
      5.2 기본적인 분류기법 ... 183
        5.2.1 인접객체법 ... 183
        5.2.2 나이브 베이지안 분류법 ... 186
      5.3 참고사항 ... 188
      연습문제 ... 189
   6장 로지스틱 회귀분석 ... 191
      6.1 이분 로지스틱 회귀모형 ... 193
        6.1.1 이분형 종속변수 ... 193
        6.1.2 로짓 변환 ... 194
        6.1.3 회귀계수의 추정 ... 195
        6.1.4 분류규칙 ... 198
        6.1.5 비용을 고려한 분류규칙 ... 201
        6.1.6 기타 변환 ... 202
      6.2 명목 로지스틱 회귀모형 ... 205
      6.3 서열 로지스틱 회귀모형 ... 209
        6.3.1 누적 로짓모형(Oumulative logit model) ... 209
        6.3.2 인근범주 로짓모형(Adjacent-categories logit model) ... 213
      6.4 참고사항 ... 215
      연습문제 ... 220
   7장 판별분석 ... 229
      7.1 피셔 방법 ... 231
        7.1.1 피셔 판별함수 ... 231
        7.1.2 분류규칙 ... 234
      7.2 의사결정론에 의한 분류규칙 ... 238
      7.3 오분류비용을 고려한 분류규칙 ... 246
      7.4 이차판별분석 ... 247
      7.5 세 범주 이상의 분류 ... 250
      7.6 참고사항 ... 253
      연습문제 ... 254
   8장 트리기반 기법 ... 261
      8.1 CART 개요 ... 263
      8.2 트리의 형성 ... 264
        8.2.1 노드 및 트리의 불순도 ... 266
        8.2.2 분지기준 ... 269
        8.2.3 최대 트리 형성 ... 274
      8.3 가지치기 및 최종 트리 선정 ... 277
        8.3.1 트리의 오분류비용 ... 277
        8.3.2 비용-복잡도 최소화에 의한 가지치기 ... 279
        8.3.3 최적 트리의 선정 ... 282
        8.3.4 범주 배정 ... 283
      8.4 기타 트리 기법 ... 284
      8.5 참고사항 ... 285
      연습문제 ... 286
   9장 서포트 벡터 머신 ... 291
      9.1 선형 SVM-분리 가능 경우 ... 293
      9.2 선형 SVM-분리 불가능 경우 ... 299
      9.3 비선형 SVM ... 303
      9.4 참고사항 ... 312
      연습문제 ... 314
   10장 분류규칙의 성능 평가 ... 317
      10.1 분류오류율 ... 319
      10.2 정확도, 민감도 및 특이도 ... 320
      10.3 ROC 곡선 ... 323
      10.4 이익도표 ... 327
      10.5 참고사항 ... 331
      연습문제 ... 332
3부 군집분석
   11장 군집분석 개요 ... 333
      11.1 군집분석 기법 ... 335
      11.2 객체 간의 유사성 척도 ... 336
        11.2.1 거리 관련 척도 ... 336
        11.2.2 상관계수 관련 척도 ... 342
      11.3 범주형 객체의 유사성 척도 ... 344
        11.3.1 이분형 변수의 경우 ... 344
        11.3.2 서열형 변수의 경우 ... 346
        11.3.3 명목형 변수의 경우 ... 347
        11.3.4 혼합형의 경우 ... 348
      11.4 참고사항 ... 349
      연습문제 ... 350
   12장 계층적 군집방법 ... 353
      12.1 군집 간 거리척도 및 연결법 ... 355
      12.2 연결법의 군집 알고리즘 ... 357
      12.3 워드 방법 ... 361
      12.4 분리적 방법-다이아나 ... 367
      12.5 군집수의 결정 ... 374
      12.6 참고사항 ... 377
      연습문제 ... 378
   13장 비계층적 군집방법 ... 383
      13.1 K-means 알고리즘 ... 385
      13.2 K-medoids 군집방법 ... 390
        13.2.1 PAM 알고리즘 ... 392
        13.2.2 CLARA 알고리즘 ... 399
        13.2.3 CLARANS 알고리즘 ... 400
        13.2.4 K-means-like 알고리즘 ... 402
      13.3 퍼지 K-means 알고리즘 ... 404
      13.4 모형기반 군집방법 ... 410
      13.5 참고사항 ... 417
      연습문제 ... 419
   14장 군집해의 평가 및 해석 ... 421
      14.1 군집해의 평가 ... 423
        14.1.1 외부평가지수 ... 423
        14.1.2 내부평가지수 ... 428
      14.2 군집해의 해석 ... 431
      14.3 참고사항 ... 433
      연습문제 ... 434
4부 연관규칙
   15장 연관규칙 ... 437
      15.1 연관규칙의 정의 및 성능척도 ... 439
      15.2 연관규칙의 탐사 ... 442
        15.2.1 빈발항목집합 생성 ... 443
        15.2.2 규칙의 탐사 ... 445
      15.3 순차적 패턴의 탐사 ... 448
        15.3.1 시퀀스 ... 448
        15.3.2 순차적 패턴 탐사 알고리즘 ... 450
        15.3.3 시퀀스 단계 ... 451
        15.3.4 개선된 시퀀스 탐사 알고리즘-AprioriSome ... 453
      15.4 항목의 선정 ... 457
      15.5 참고사항 ... 458
      연습문제 ... 460
   16장 추천시스템 ... 463
      16.1 내용기반 추천시스템 ... 465
      16.2 협업 필터링 ... 467
      16.3 시장바구니 데이터를 이용한 협업 필터링 ... 469
      16.4 참고사항 ... 472
      연습문제 ... 473
부록 _ 통계분포표 ... 475
찾아보기 ... 483
닫기