비즈니스 애널리틱스를 위한 데이터 마이닝 in 파이썬

비즈니스 애널리틱스를 위한 데이터 마이닝 in 파이썬

$44.42
Description
데이터 마이닝의 개념, 기법, 응용
다양한 분석 기법이 존재하는 이유는 각 분석 기법마다 장단점이 있기 때문이다. 데이터를 분석하는 목적, 데이터의 양·유형·노이즈 등에 따라 적합한 분석 기법이 달라진다. 이 책은 전통적인 통계 기법부터 머신러닝 기법까지 데이터 마이닝 기술 전반을 다루어, 주어진 상황에 적합한 분석 기법을 선택할 수 있는 힘을 키워준다. 또한 풍부한 연습문제와 9개의 실전 사례를 통해 실전 감각도 기를 수 있다.
※ 본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.
저자

갈리트시뮤엘리,PeterC.Bruce,피터게데크,NitinR.Patel

대만국립칭화대학교의서비스사이언스대학원특임교수다.정보시스템분야와헬스케어분야에서통계,데이터마이닝방법론을활용한비즈니스애널리틱스분야를연구하고,도서와논문100여편이상을출판하였다.

목차

PART01준비
Chapter01서문
1.1비즈니스애널리틱스정의
1.2데이터마이닝정의
1.3데이터마이닝관련용어
1.4빅데이터
1.5데이터사이언스
1.6다양한분석방법이존재하는이유
1.7용어와표기법
1.8로드맵

Chapter02데이터마이닝프로세스개요
2.1서론
2.2데이터마이닝의핵심아이디어
2.3데이터마이닝수행단계
2.4데이터분석사전단계
2.5예측력과과적합
2.6모델구축:선형회귀분석을이용한예제
2.7로컬컴퓨터에서파이썬을이용한데이터마이닝
2.8데이터마이닝과정의자동화
2.9데이터마이닝의윤리이슈
연습문제

PART02데이터탐색과차원축소
Chapter03데이터시각화
3.1개요
3.2예제데이터
3.3기본차트:막대그래프,선그래프,산점도
3.4다차원시각화
3.5특수시각화
3.6주요시각화작업요약
연습문제

Chapter04차원축소
4.1서론
4.2차원의저주
4.3실질적인고려사항
4.4데이터요약
4.5상관분석
4.6범주형변수의범주개수축소
4.7범주형변수에서수치형변수로의변환
4.8주성분분석
4.9회귀모델을사용한차원축소
4.10분류트리와회귀트리를이용한차원축소
연습문제

PART03성능평가
Chapter05예측성능평가
5.1서론
5.2예측성능의평가
5.3분류기성능의판단
5.4랭킹성능의판단
5.5오버샘플링
연습문제

PART04예측및분류
Chapter06다중선형회귀
6.1서론
6.2설명모델과예측모델의모델링
6.3회귀식의추정과예측
6.4선형회귀분석의변수선택
연습문제

Chapter07k-NN알고리즘
7.1k-NN분류기(범주형결과)
7.2k-NN예측기(수치형결과)
7.3k-NN알고리즘의장점과단점
연습문제

Chapter08나이브베이즈분류기
8.1서론
8.2완전한(정확한)베이지안분류기의적용
8.3나이브베이즈분류기의장점과단점
연습문제

Chapter09분류회귀트리
9.1서론
9.2분류트리
9.3분류트리의성능평가
9.4과적합방지하기
9.5분류트리모델의분류규칙
9.63개이상의클래스분류하기
9.7회귀트리모델
9.8예측력향상:랜덤포레스트와부스트트리
9.9트리모델의장점과단점
연습문제

Chapter10로지스틱회귀분석
10.1서론
10.2로지스틱회귀모델
10.3예제:개인대출신청수락
10.4분류성능평가
10.5다중클래스분류에대한로지스틱회귀
10.6분석예제:연착항공편예측
연습문제

Chapter11신경망
11.1서론
11.2신경망의개념과구조
11.3데이터에신경망적합하기
11.4요구되는사용자입력
11.5예측변수들과결과변수간의관계탐색
11.6딥러닝
11.7신경망의장점과단점
연습문제

Chapter12판별분석
12.1서론
12.2클래스로부터관측치에이르는거리
12.3피셔의선형분류함수
12.4판별분석의분류성능
12.5사전확률
12.6서로다른오분류비용
12.7클래스가3개이상일경우의분류
12.8판별분석의장점과단점
연습문제

Chapter13방법론결합:앙상블과업리프트모델링
13.1앙상블
13.2업리프트모델링
13.3요약
연습문제

PART05레코드간의마이닝관계
Chapter14연관규칙과협업필터링
14.1연관규칙
14.2협업필터링
14.3요약
연습문제

Chapter15군집분석
15.1서론
15.2두레코드사이의거리측정
15.3두군집사이의거리측정
15.4계층적응집군집화
15.5비계층적군집화:k-평균군집화방법
연습문제

PART06시계열예측
Chapter16시계열데이터분석
16.1서론
16.2탐색모델vs.예측모델
16.3비즈니스에서주로사용되는예측기법
16.4시계열요소
16.5데이터분할및성능평가
연습문제

Chapter17회귀분석을기반으로한예측
17.1추세를반영한모델
17.2계절성을반영한모델
17.3추세와계절성을반영한모델
17.4자기상관과아리마모델
연습문제

Chapter18평활법
18.1서론
18.2이동평균법
18.3단순지수평활법
18.4고급지수평활법
연습문제

PART07데이터분석
Chapter19소셜네트워크애널리틱스
19.1서론
19.2방향/무방향네트워크
19.3네트워크분석과시각화
19.4소셜데이터의측정측도와분류
19.5네트워크측도를이용한예측과분류
19.6파이썬을이용한소셜네트워크데이터수집
19.7소셜네트워크애널리틱스의장점과단점
연습문제

Chapter20텍스트마이닝
20.1서론
20.2텍스트의표형식:용어-문서행렬과‘단어주머니’
20.3단어주머니vs.문서수준의의미추출
20.4텍스트의전처리
20.5데이터마이닝방법의구현
20.6예제:자동차와전자제품에대한온라인논의
20.7요약
연습문제

PART08사례
Chapter21사례
21.1찰스북클럽
21.2독일신용평가자료
21.3테이코소프트웨어카탈로그판매회사
21.4유권자
21.5택시예약취소
21.6목욕비누구매자세분화
21.7직접우편기금조성
21.8카탈로그교차판매
21.9시계열사례:대중교통수요예측
이책에사용된데이터파일목록
부록:파이썬유틸리티함수
참고문헌
찾아보기

출판사 서평

관련도서
『ITCookBook,데이터과학을위한파이썬머신러닝』(한빛아카데미,2022)
『비즈니스애널리틱스』(한빛아카데미,2021)
『기계학습』(한빛아카데미,2017)