목차
1장 데이터마이닝 
  1.1 데이터마이닝이란? = 3
    1.1.1 데이터마이닝 = 4
    1.1.2 데이터마이닝 응용분야 = 5
  1.2 데이터마이닝 역사 = 7
  1.3 데이터마이닝 과정 = 9
  1.4 이 책의 구성 = 10
  1.5 데이터마이닝 시스템 = 12
  1.6 데이터마이닝 참고문헌 및 학술회의 = 13
  1.7 이 책에 사용된 데이터 기호의 설명 = 16
2장 탐색적 데이터 분석 
  2.1 데이터의 탐색 = 21
    2.1.1 데이터의 분류 = 21
    2.1.2 데이터의 품질 = 24
  2.2 그림을 이용한 데이터 탐색 = 25
    2.2.1 한 변수에 대한 그림 = 25
    2.2.2 두 변수의 그림 = 28
    2.2.3 다중 변수의 그림 = 29
  2.3 통계표/통계량을 이용한 데이터 탐색 = 33
    2.3.1 한 변수의 통계표/통계량 = 33
    2.3.2 두 변수의 통계표/통계량 = 38
    2.3.3 다중 변수의 통계표 및 통계량 = 40
  2.4 통계분포를 이용한 데이터 모형 = 42
    2.4.1 한 변수의 통계분포 = 43
    2.4.2 다중 변수의 통계분포 = 45
    2.4.3 분포함수의 추정 = 46
  2.5 데이터의 변환 = 47
    2.5.1 데이터의 변환(Transformation) = 48
    2.5.2 데이터 차원의 축소(Dimension Reduction) = 50
  2.6 데이터의 유사성 측도 = 53
    2.6.1 한 변수의 유사성/비유사성 측도 = 53
    2.6.2 다중 변수의 비유사성 측도 = 53
  2.7 R 및 SAS 실습 = 56
    2.7.1 R을 이용한 실습 = 56
    2.7.2 SAS를 이용한 실습 = 60
    2.7.3 SAS/E-Miner를 이용한 데이터 탐색 = 64
3장 데이터베이스 시스템과 다차원분석 
  3.1 데이터베이스 시스템(Database System) = 79
    3.1.1 데이터베이스 관리 시스템(Database Management System) = 80
    3.1.2 데이터 웨어하우스(Data Warehouse) = 81
  3.2 관계형 데이터베이스(Relational Database) = 83
    3.2.1 데이터의 구조(Data Structure) = 84
    3.2.2 관계형 데이터베이스(Relational Database) = 84
    3.2.3 관계형 테이블(Table)과 키(Key) = 86
  3.3 데이터베이스 언어-SQL = 88
    3.3.1 데이터베이스 및 테이블 정의문(Definition Statement) = 88
    3.3.2 데이터 조작문(Manipulation Statement) = 92
    3.3.3 함수(Function) = 100
    3.3.4 데이터베이스 객체(Object) = 103
  3.4 다차원분석 및 OLAP = 105
    3.4.1 다차원분석(Multi-dimensional Analysis) = 105
    3.4.2 온라인 분석 시스템(OLAP) = 107
  3.5 MS-SQL 실습 = 108
4장 연관분석 
  4.1 연관분석(Association Analysis)의 기본개념 = 119
  4.2 이항 데이터의 연관분석 - 선험적 알고리즘(Apriori Algorithm) = 122
    4.2.1 선험적 규칙(Apriori Principle) = 123
    4.2.2 선험적 알고리즘에서 빈발항목집합 후보의 생성 = 126
    4.2.3 빈발항목집합을 이용한 연관규칙 생성 = 128
  4.3 연관규칙의 평가 = 130
    4.3.1 객관적 흥미측도 - 두 항목의 경우 = 131
    4.3.2 객관적 흥미측도 - 두 항목 이상의 경우 = 136
    4.3.3 객관적 흥미측도 - 항목들의 지지도가 매우 다를 경우 = 137
  4.4 범주형 및 연속형 데이터의 연관분석 = 139
    4.4.1 범주형 데이터의 연관분석 = 139
    4.4.2 연속형 데이터의 연관분석 = 140
  4.5 항목 출현순서의 연관분석 = 143
    4.5.1 출현순서패턴의 기본개념 = 143
    4.5.2 출현순서패턴 탐색 알고리즘 = 145
  4.6 비빈발패턴 탐색 = 146
    4.6.1 흥미 있는 비빈발패턴의 정의 = 146
    4.6.2 비빈발패턴의 탐색방법 = 148
  4.7 R 및 SAS 실습 = 149
    4.7.1 R 실습 = 149
    4.7.2 SAS 실습 = 152
5장 분류분석 Ⅰ 
  5.1 분류분석의 기본개념 = 169
    5.1.1 분류분석의 절차 = 170
    5.1.2 분류분석을 위한 데이터의 준비 = 171
    5.1.3 분류모형의 평가 측도 = 171
    5.1.4 훈련용과 시험용 데이터의 분할 방법 = 172
  5.2 베이즈분류(Bayes Classification) 모형 = 174
    5.2.1 한 변수일 경우의 베이즈분류 = 175
    5.2.2 다중변수의 베이즈분류 = 178
    5.2.3 변수의 선택 - 단계적 분류분석 = 184
    5.2.4 베이즈분류의 특성 = 185
  5.3 로지스틱회귀(Logistic Regression) 모형 = 185
    5.3.1 프로빗 모형과 곰페르츠 모형 = 187
    5.3.2 다변수 로지스틱회귀 모형 = 187
    5.3.3 오즈비 증가비율 = 187
    5.3.4 변수의 선택 = 188
  5.4 의사결정나무(Decision Tree) 모형 = 190
    5.4.1 의사결정나무 알고리즘 = 191
    5.4.2 가지분할을 위한 변수의 선택 = 192
    5.4.3 의사결정나무의 예 = 199
    5.4.4 연속형 변수의 가지분할 = 205
    5.4.5 의사결정나무의 가지치기 = 207
    5.4.6 회귀나무 모형 = 207
    5.4.7 의사결정나무 모형의 특성 = 208
  5.5 분류모형의 평가 = 210
    5.5.1 분류모형 평가를 위한 기타 측도 = 210
    5.5.2 분류모형의 비교 = 218
  5.6 R 및 SAS 실습 = 221
    5.6.1 R 실습 = 221
    5.6.2 SAS 실습 = 227
6장 분류분석 Ⅱ 
  6.1 규칙기반분류(Rule Based Classification) 모형 = 239
    6.1.1 분류규칙의 평가 = 239
    6.1.2 여러 분류규칙의 적용 = 241
    6.1.3 분류규칙의 생성 = 242
    6.1.4 규칙기반분류 모형의 특성 = 246
  6.2 인접이웃분류(Nearest Neighbor Classification) 모형 = 247
    6.2.1 k-인접이웃분류 알고리즘 = 248
    6.2.2 인접이웃분류 모형의 특성 = 250
  6.3 신경망(Neural Network) 모형 = 250
    6.3.1 단층신경망(single-layer Neural Network) = 252
    6.3.2 다층신경망(Multilayer Neural Network) = 257
    6.3.3 신경망 모형의 특성 = 264
  6.4 지지벡터기계(Support Vector Machine) 모형 = 265
    6.4.1 선형 SVM = 265
    6.4.2 비선형 SVM = 271
    6.4.3 지지벡터기계 모형의 특성 = 271
  6.5 앙상블(Ensemble) 모형 = 271
    6.5.1 배깅(Bagging) = 273
    6.5.2 부스팅(Boosting) = 275
    6.5.3 랜덤포리스트(Random Forest) = 280
  6.6 여러 집단의 분류 = 281
  6.7 R 및 SAS 실습 = 282
    6.7.1 R실습 = 282
    6.7.2 SAS 실습 = 290
7장 군집분석 
  7.1 군집분석의 기본개념 = 301
    7.1.1 군집분석 모형의 구분 = 301
    7.1.2 군집분석 모형의 평가 = 302
  7.2 계층적군집(Hierarchical Clustering) 모형 = 303
    7.2.1 군집간의 연결법 = 305
    7.2.2 계층적군집 모형의 특성 = 313
  7.3 K-중심군집(-Centroid Clustering) 모형 = 314
    7.3.1 K-중심군집 모형의 이론적 배경 = 316
    7.3.2 K-중심군집 모형의 특성 = 317
  7.4 퍼지군집(Fuzzy Clustering) 모형 = 318
  7.5 혼합분포군집(Mixture Distribution Clustering) 모형 = 322
    7.5.1 혼합분포(Mixture Distribution) 모형 = 322
    7.5.2 혼합분포 모형의 모수 추정 = 324
    7.5.3 혼합분포군집 모형의 특성 = 327
  7.6 밀도기반군집(Density-based Clustering) 모형 = 327
    7.6.1 중심밀도군집(Center Density Clustering) 모형 = 327
    7.6.2 격자기반군집(Grid-based Clustering) 모형 = 329
    7.6.3 커넬기반군집(Kernel-based Clustering) 모형 = 331
  7.7 코호넨군집(Kohonen Clustering) 모형 = 333
    7.7.1 코호넨군집 모형의 특성 = 335
  7.8 R 및 SAS 실습 = 336
    7.8.1 R 실습 = 336
    7.8.2 SAS 실습 = 345
8장 특이데이터 탐색 
  8.1 특이데이터(Anomaly Data)란? = 357
  8.2 통계적 탐색방법 = 358
  8.3 유사성기반(Proximity-based) 탐색방법 = 361
  8.4 밀도기반(Density-based) 탐색방법 = 363
  8.5 군집기반(Cluster-based) 탐색방법 = 364
9장 데이터마이닝의 응용 
  9.1 텍스트 데이터마이닝(Text Data Mining) = 371
  9.2 웹 데이터마이닝(Web Data Mining) = 373
  9.3 멀티미디어 데이터마이닝(Multimedia Data Mining) = 376
  9.4 시계열 데이터마이닝(Time Series Data Mining) = 378
  9.5 공간 데이터마이닝(Spatial Data Mining) = 383
부록 
  A.1 R의 설치 및 기본운용 = 389
    A.1.1 R의 설치 = 389
    A.1.2 R의 기본운용 = 393
  A.2 SAS의 설치 및 기본운용 = 400
    A.2.1 SAS의 설치 = 400
    A.2.2 SAS의 기본운용 = 407
    A.2.3 SAS Enterprise Miner의 기본운용 = 418
  A.3 MS-SQL 설치 및 기본운용 = 435
    A.3.1 MS-SQL의 설치 = 435
    A.3.2 MS-SQL의 기본운용 = 439
  찾아보기 = 449
닫기