데이터 마이닝 (2 판)

데이터 마이닝 (2 판)

$50.99
Description
Pang-Ning Tan , Michael Steinbach , Anuj Karpatne , Vipin Kumar 『데이터 마이닝』은 〈데이터 마이닝이란 무엇인가?〉, 〈도전에 동기부여하기〉, 〈데이터 마이닝의 기원〉, 〈데이터 마이닝 작업〉, 〈책의 범위와 구성〉 등이 수록되어 있다.
저자

Pang-NingTan

출간작으로『데이터마이닝』등이있다.

목차

CHAPTER1 서론
1.1 데이터마이닝이란무엇인가? 4
1.2 도전에동기부여하기 5
1.3 데이터마이닝의기원 7
1.4 데이터마이닝작업 9
1.5 책의범위와구성 14
1.6 참고문헌설명 15
1.7 연습문제 22

CHAPTER2 데이터
2.1 데이터의타입 26
2.1.1 속성과측정 27
2.1.2 데이터집합의타입 34
2.2 데이터품질 42
2.2.1 측정과데이터수집문제 43
2.2.2 응용과관련된문제 50
2.3 데이터전처리 51
2.3.1 총계 52
2.3.2 표본추출 54
2.3.3 차원축소 57
2.3.4 특징부분집합선택 59
2.3.5 특징생성 62
2.3.6 이산화와이진화 64
2.3.7 변수변환 70
2.4 유사도와비유사도의척도 72
2.4.1 기초 73
2.4.2 단순속성간의유사도와비유사도 75
2.4.3 데이터객체간의비유사도 76
2.4.4 데이터객체간의유사도 79
2.4.5 근접도척도의예 80
2.4.6 상호정보 90
2.4.7 커널함수* 91
2.4.8 브레그만발산* 96
2.4.9 근접도계산의문제들 98
2.4.10 올바른근접도척도의선택 101
2.5 참고문헌설명 103
2.6 연습문제 109

CHAPTER3 분류:기본개념과기법
3.1 기본개념 118
3.2 분류를위한일반적인구조 122
3.3 의사결정트리분류기(DecisionTreeClassifier) 124
3.3.1 기본적인의사결정트리구축알고리즘 126
3.3.2 속성시험조건표현방법 130
3.3.3 속성시험조건선택척도 132
3.3.4 의사결정트리귀납알고리즘 142
3.3.5 응용예:웹로봇탐지 144
3.3.6 의사결정트리분류기의특성 146
3.4 모델과잉적합 154
3.4.1 모델과잉적합의원인 156
3.5 모델선택 162
3.5.1 검증집합의사용 163
3.5.2 모델복잡도추가하기 164
3.5.3 통계적한계의추정 168
3.5.4 의사결정트리를위한모델선택 169
3.6 모델평가 171
3.6.1 홀드아웃방법 172
3.6.2 교차검증 173
3.7 하이퍼파라미터의존재 175
3.7.1 하이퍼파라미터선택 176
3.7.2 중첩교차검증 178
3.8 모델선택과평가의문제들 179
3.8.1 훈련집합과시험집합의중복 180
3.8.2 일반화오류로검증오류의사용 180
3.9 모델비교 181
3.9.1 정확도의신뢰구간추정하기 182
3.9.2 두모델의성능비교 184
3.10 참고문헌설명 185
3.11 연습문제 194

CHAPTER4 분류:기타기법
4.1 분류기의종류 203
4.2 규칙기반분류기 205
4.2.1 규칙기반분류기가작동하는방식 208
4.2.2 규칙집합의속성 208
4.2.3 규칙추출을위한직접적인방법 210
4.2.4 규칙추출을위한간접적방법 215
4.2.5 규칙기반분류기의특성 218
4.3 최근접분류기(NearestNeighborClassifiers) 219
4.3.1 알고리즘 221
4.3.2 최근접이웃분류기의특성 222
4.4 나이브베이지안(NaiveBayes)분류기 223
4.4.1 확률론의기초 224
4.4.2 나이브베이즈가정 229
4.5 베이지안네트워크 239
4.5.1 그래픽표현 239
4.5.2 추론과학습 245
4.5.3 베이지안네트워크의특성 253
4.6 로지스틱회귀(LogisticRegression) 254
4.6.1 일반화된선형모형으로서의로지스틱회귀 256
4.6.2 학습모델매개변수 257
4.6.3 로지스틱회귀의특성 259
4.7 인공신경망네트워크(ANN) 260
4.7.1 퍼셉트론 262
4.7.2 다계층신경망 265
4.7.3 ANN의특성 271
4.8 딥러닝(DeepLearning) 273
4.8.1 시너지를가져오는손실함수사용 274
4.8.2 반응형활성함수사용 277
4.8.3 정규화 279
4.8.4 모델매개변수의초기화 282
4.8.5 딥러닝의특징 286
4.9 서포트벡터머신(SVM) 287
4.9.1 분리초평면의여백 287
4.9.2 선형SVM 289
4.9.3 소프트마진SVM 295
4.9.4 비선형SVM 301
4.9.5 SVM의특성 305
4.10 앙상블기법(EnsenbleMethod) 307
4.10.1 앙상블기법의이론적근거 307
4.10.2 앙상블분류기구축법 309
4.10.3 바이어스-분산분해(Bias-VarianceDecomposition) 311
4.10.4 배깅(bagging) 313
4.10.5 부스팅(boosting) 315
4.10.6 랜덤포레스트(randomforest) 321
4.10.7 앙상블방법간의경험적비교 323
4.11 클래스불균형문제 324
4.11.1 클래스불균형을가진건물분류 325
4.11.2 클래스불균형으로성능평가 328
4.11.3 최적의점수임계치찾기 333
4.11.4 종합적인성능평가 334
4.12 멀티클래스문제 341
4.13 참고문헌설명 344
4.14 연습문제 358

CHAPTER5 연관분석:기본개념과알고리즘
5.1 서문 371
5.2 빈발항목집합생성 375
5.2.1 원리 377
5.2.2 알고리즘에서빈발항목집합생성 379
5.2.3 후보생성과가지치기 382
5.2.4 지지도계산 387
5.2.5 계산복잡도 392
5.3 규칙생성 395
5.3.1 신뢰도-기반가지치기 395
5.3.2 알고리즘에서규칙생성 396
5.3.3 예제:의회투표기록 398
5.4 빈발항목집합의간결한표현 399
5.4.1 최대빈발항목집합 399
5.4.2 닫힌빈발항목집합 401
5.5 빈발항목집합생성을위한대체방법* 406
5.6 FP-Growth알고리즘* 411
5.6.1 FP-트리표현 411
5.6.2 FP-Growth알고리즘에서빈발항목집합생성 414
5.7 연관패턴의평가 418
5.7.1 흥미도의객관적척도 419
5.7.2 이진변수쌍을넘어선척도 432
5.7.3 Simpson의역설 434
5.8 편향지지도분포의영향 436
5.9 참고문헌설명 442
5.10 연습문제 458
CHAPTER6 연관분석:고급개념
6.1 범주형속성처리 471
6.2 연속형속성처리 474
6.2.1 이산화-기반방법 475
6.2.2 통계-기반방법 479
6.2.3 비-이산화방법 481
6.3 개념계층처리 483
6.4 순차패턴 485
6.4.1 서문 486
6.4.2 순차패턴발견 489
6.4.3 시간제약조건* 495
6.4.4 대체계산방법* 499
6.5 부분그래프패턴 502
6.5.1 서문 503
6.5.2 빈발부분그래프탐사 507
6.5.3 후보생성 511
6.5.4 후보가지치기 516
6.5.5 지지도계산 517
6.6 비빈발패턴* 517
6.6.1 음의패턴 518
6.6.2 음의상관관계패턴 519
6.6.3 비빈발패턴,음의패턴및음의상관관계패턴사이의비교 521
6.6.4 흥미로운비빈발패턴을탐사하는기법 522
6.6.5 음의패턴탐사에근거한기법 523
6.6.6 지지도기댓값에근거한기법 526
6.7 참고문헌설명 530
6.8 연습문제 535

CHAPTER7 군집분석:기본개념과알고리즘
7.1 개요 554
7.1.1 군집화분석이란? 554
7.1.2 군집화의종류 556
7.1.3 군집의종류 557
7.2 K-means 561
7.2.1 기본K-means알고리즘 561
7.2.2 K-means:기타사항 572
7.2.3 이등분K-means 574
7.2.4 K-means와다양한종류의군집들 576
7.2.5 강점과약점 579
7.2.6 최적화문제로서의K-means 579
7.3 병합형계층군집화(AgglomerativeHierarchicalClustering) 581
7.3.1 기본적인병합형계층군집화알고리즘 582
7.3.2 구체적인기법들 584
7.3.3 군집인접성에대한Lance-Williams공식 590
7.3.4 계층군집화의주요문제점 591
7.3.5 이상치 593
7.3.6 강점과약점 593
7.4 DBSCAN 593
7.4.1 전통적밀도:중심기반의방법 594
7.4.2 DBSCAN알고리즘 596
7.4.3 강점과약점 600
7.5 군집평가 600
7.5.1 개요 602
7.5.2 응집도와분리도를이용한무감독군집평가 604
7.5.3 인접성행렬을이용한무감독군집평가 612
7.5.4 계층군집화의무감독평가 616
7.5.5 정확한군집의수결정하기 617
7.5.6 군집화경향 618
7.5.7 군집유효성에대한감독척도 620
7.5.8 군집유효성척도들의중요도평가 625
7.5.9 군집유효성의척도결정 627
7.6 참고문헌설명 629
7.7 연습문제 635
CHAPTER8 군집분석:기타주제와알고리즘
8.1 데이터,군집및군집화알고리즘의특성 646
8.1.1 예:K-means와DBSCAN비교 646
8.1.2 데이터특성 647
8.1.3 군집의특성 649
8.1.4 군집알고리즘의일반적인특성 651
8.2 프로토타입기반군집화 653
8.2.1 퍼지군집화 653
8.2.2 혼합모델을사용한군집화 659
8.2.3 자기구성지도(SOM) 670
8.3 밀도기반군집화 676