목차 일부
1장 데이터마이닝
1.1 데이터마이닝이란? = 3
1.1.1 데이터마이닝 = 4
1.1.2 데이터마이닝 응용분야 = 5
1.2 데이터마이닝 역사 = 7
1.3 데이터마이닝 과정 = 9
1.4 이 책의 구성 = 10
1.5 데이터마이닝 시스템 = 12
1.6 데이터마이닝 참고문헌 및 학술회의 = 13
...
더보기
목차 전체
1장 데이터마이닝
1.1 데이터마이닝이란? = 3
1.1.1 데이터마이닝 = 4
1.1.2 데이터마이닝 응용분야 = 5
1.2 데이터마이닝 역사 = 7
1.3 데이터마이닝 과정 = 9
1.4 이 책의 구성 = 10
1.5 데이터마이닝 시스템 = 12
1.6 데이터마이닝 참고문헌 및 학술회의 = 13
1.7 이 책에 사용된 데이터 기호의 설명 = 16
2장 탐색적 데이터 분석
2.1 데이터의 탐색 = 21
2.1.1 데이터의 분류 = 21
2.1.2 데이터의 품질 = 24
2.2 그림을 이용한 데이터 탐색 = 25
2.2.1 한 변수에 대한 그림 = 25
2.2.2 두 변수의 그림 = 28
2.2.3 다중 변수의 그림 = 29
2.3 통계표/통계량을 이용한 데이터 탐색 = 33
2.3.1 한 변수의 통계표/통계량 = 33
2.3.2 두 변수의 통계표/통계량 = 38
2.3.3 다중 변수의 통계표 및 통계량 = 40
2.4 통계분포를 이용한 데이터 모형 = 42
2.4.1 한 변수의 통계분포 = 43
2.4.2 다중 변수의 통계분포 = 45
2.4.3 분포함수의 추정 = 46
2.5 데이터의 변환 = 47
2.5.1 데이터의 변환(Transformation) = 48
2.5.2 데이터 차원의 축소(Dimension Reduction) = 50
2.6 데이터의 유사성 측도 = 53
2.6.1 한 변수의 유사성/비유사성 측도 = 53
2.6.2 다중 변수의 비유사성 측도 = 53
2.7 R 및 SAS 실습 = 56
2.7.1 R을 이용한 실습 = 56
2.7.2 SAS를 이용한 실습 = 60
2.7.3 SAS/E-Miner를 이용한 데이터 탐색 = 64
3장 데이터베이스 시스템과 다차원분석
3.1 데이터베이스 시스템(Database System) = 79
3.1.1 데이터베이스 관리 시스템(Database Management System) = 80
3.1.2 데이터 웨어하우스(Data Warehouse) = 81
3.2 관계형 데이터베이스(Relational Database) = 83
3.2.1 데이터의 구조(Data Structure) = 84
3.2.2 관계형 데이터베이스(Relational Database) = 84
3.2.3 관계형 테이블(Table)과 키(Key) = 86
3.3 데이터베이스 언어-SQL = 88
3.3.1 데이터베이스 및 테이블 정의문(Definition Statement) = 88
3.3.2 데이터 조작문(Manipulation Statement) = 92
3.3.3 함수(Function) = 100
3.3.4 데이터베이스 객체(Object) = 103
3.4 다차원분석 및 OLAP = 105
3.4.1 다차원분석(Multi-dimensional Analysis) = 105
3.4.2 온라인 분석 시스템(OLAP) = 107
3.5 MS-SQL 실습 = 108
4장 연관분석
4.1 연관분석(Association Analysis)의 기본개념 = 119
4.2 이항 데이터의 연관분석 - 선험적 알고리즘(Apriori Algorithm) = 122
4.2.1 선험적 규칙(Apriori Principle) = 123
4.2.2 선험적 알고리즘에서 빈발항목집합 후보의 생성 = 126
4.2.3 빈발항목집합을 이용한 연관규칙 생성 = 128
4.3 연관규칙의 평가 = 130
4.3.1 객관적 흥미측도 - 두 항목의 경우 = 131
4.3.2 객관적 흥미측도 - 두 항목 이상의 경우 = 136
4.3.3 객관적 흥미측도 - 항목들의 지지도가 매우 다를 경우 = 137
4.4 범주형 및 연속형 데이터의 연관분석 = 139
4.4.1 범주형 데이터의 연관분석 = 139
4.4.2 연속형 데이터의 연관분석 = 140
4.5 항목 출현순서의 연관분석 = 143
4.5.1 출현순서패턴의 기본개념 = 143
4.5.2 출현순서패턴 탐색 알고리즘 = 145
4.6 비빈발패턴 탐색 = 146
4.6.1 흥미 있는 비빈발패턴의 정의 = 146
4.6.2 비빈발패턴의 탐색방법 = 148
4.7 R 및 SAS 실습 = 149
4.7.1 R 실습 = 149
4.7.2 SAS 실습 = 152
5장 분류분석 Ⅰ
5.1 분류분석의 기본개념 = 169
5.1.1 분류분석의 절차 = 170
5.1.2 분류분석을 위한 데이터의 준비 = 171
5.1.3 분류모형의 평가 측도 = 171
5.1.4 훈련용과 시험용 데이터의 분할 방법 = 172
5.2 베이즈분류(Bayes Classification) 모형 = 174
5.2.1 한 변수일 경우의 베이즈분류 = 175
5.2.2 다중변수의 베이즈분류 = 178
5.2.3 변수의 선택 - 단계적 분류분석 = 184
5.2.4 베이즈분류의 특성 = 185
5.3 로지스틱회귀(Logistic Regression) 모형 = 185
5.3.1 프로빗 모형과 곰페르츠 모형 = 187
5.3.2 다변수 로지스틱회귀 모형 = 187
5.3.3 오즈비 증가비율 = 187
5.3.4 변수의 선택 = 188
5.4 의사결정나무(Decision Tree) 모형 = 190
5.4.1 의사결정나무 알고리즘 = 191
5.4.2 가지분할을 위한 변수의 선택 = 192
5.4.3 의사결정나무의 예 = 199
5.4.4 연속형 변수의 가지분할 = 205
5.4.5 의사결정나무의 가지치기 = 207
5.4.6 회귀나무 모형 = 207
5.4.7 의사결정나무 모형의 특성 = 208
5.5 분류모형의 평가 = 210
5.5.1 분류모형 평가를 위한 기타 측도 = 210
5.5.2 분류모형의 비교 = 218
5.6 R 및 SAS 실습 = 221
5.6.1 R 실습 = 221
5.6.2 SAS 실습 = 227
6장 분류분석 Ⅱ
6.1 규칙기반분류(Rule Based Classification) 모형 = 239
6.1.1 분류규칙의 평가 = 239
6.1.2 여러 분류규칙의 적용 = 241
6.1.3 분류규칙의 생성 = 242
6.1.4 규칙기반분류 모형의 특성 = 246
6.2 인접이웃분류(Nearest Neighbor Classification) 모형 = 247
6.2.1 k-인접이웃분류 알고리즘 = 248
6.2.2 인접이웃분류 모형의 특성 = 250
6.3 신경망(Neural Network) 모형 = 250
6.3.1 단층신경망(single-layer Neural Network) = 252
6.3.2 다층신경망(Multilayer Neural Network) = 257
6.3.3 신경망 모형의 특성 = 264
6.4 지지벡터기계(Support Vector Machine) 모형 = 265
6.4.1 선형 SVM = 265
6.4.2 비선형 SVM = 271
6.4.3 지지벡터기계 모형의 특성 = 271
6.5 앙상블(Ensemble) 모형 = 271
6.5.1 배깅(Bagging) = 273
6.5.2 부스팅(Boosting) = 275
6.5.3 랜덤포리스트(Random Forest) = 280
6.6 여러 집단의 분류 = 281
6.7 R 및 SAS 실습 = 282
6.7.1 R실습 = 282
6.7.2 SAS 실습 = 290
7장 군집분석
7.1 군집분석의 기본개념 = 301
7.1.1 군집분석 모형의 구분 = 301
7.1.2 군집분석 모형의 평가 = 302
7.2 계층적군집(Hierarchical Clustering) 모형 = 303
7.2.1 군집간의 연결법 = 305
7.2.2 계층적군집 모형의 특성 = 313
7.3 K-중심군집(-Centroid Clustering) 모형 = 314
7.3.1 K-중심군집 모형의 이론적 배경 = 316
7.3.2 K-중심군집 모형의 특성 = 317
7.4 퍼지군집(Fuzzy Clustering) 모형 = 318
7.5 혼합분포군집(Mixture Distribution Clustering) 모형 = 322
7.5.1 혼합분포(Mixture Distribution) 모형 = 322
7.5.2 혼합분포 모형의 모수 추정 = 324
7.5.3 혼합분포군집 모형의 특성 = 327
7.6 밀도기반군집(Density-based Clustering) 모형 = 327
7.6.1 중심밀도군집(Center Density Clustering) 모형 = 327
7.6.2 격자기반군집(Grid-based Clustering) 모형 = 329
7.6.3 커넬기반군집(Kernel-based Clustering) 모형 = 331
7.7 코호넨군집(Kohonen Clustering) 모형 = 333
7.7.1 코호넨군집 모형의 특성 = 335
7.8 R 및 SAS 실습 = 336
7.8.1 R 실습 = 336
7.8.2 SAS 실습 = 345
8장 특이데이터 탐색
8.1 특이데이터(Anomaly Data)란? = 357
8.2 통계적 탐색방법 = 358
8.3 유사성기반(Proximity-based) 탐색방법 = 361
8.4 밀도기반(Density-based) 탐색방법 = 363
8.5 군집기반(Cluster-based) 탐색방법 = 364
9장 데이터마이닝의 응용
9.1 텍스트 데이터마이닝(Text Data Mining) = 371
9.2 웹 데이터마이닝(Web Data Mining) = 373
9.3 멀티미디어 데이터마이닝(Multimedia Data Mining) = 376
9.4 시계열 데이터마이닝(Time Series Data Mining) = 378
9.5 공간 데이터마이닝(Spatial Data Mining) = 383
부록
A.1 R의 설치 및 기본운용 = 389
A.1.1 R의 설치 = 389
A.1.2 R의 기본운용 = 393
A.2 SAS의 설치 및 기본운용 = 400
A.2.1 SAS의 설치 = 400
A.2.2 SAS의 기본운용 = 407
A.2.3 SAS Enterprise Miner의 기본운용 = 418
A.3 MS-SQL 설치 및 기본운용 = 435
A.3.1 MS-SQL의 설치 = 435
A.3.2 MS-SQL의 기본운용 = 439
찾아보기 = 449
더보기 닫기