데이터 분석과 머신러닝 실전 (R & Python과 함께하는 여정)

데이터 분석과 머신러닝 실전 (R & Python과 함께하는 여정)

$32.50
저자

조희수

경희대학교에서경영정보시스템을전공하며박사학위를취득하였다.한국도로공사ICT센터,스마트톨링추진단,영업시스템처등에서근무하면서공공서비스분야의IT혁신을주도해왔으며,현재는산업현장에서데이터기반의사결정지원과기술적용확산에기여하고있다.
아울러국립창원대학교빅데이터자산관리학과와김천대학교스마트물류시스템공학과에서겸임교수로재직하며빅데이터,통계,머신러닝,인공지능과목을강의하고있으며,풍부한실무경험을바탕으로실용적이고문제해결중심의인재양성에힘쓰고있다.

목차

Chapter01분석환경구축

제1절분석환경이해 3
제2절R과RStudio설치(Windows기준) 4
1.R설치 4
2.RStudio설치 5
3.프로젝트생성 8
제3절Python과아나콘다설치(Windows기준) 10
1.아나콘다설치 10
2.주피터노트북활용 12
제4절프로그래밍기초문법 15
1.변수 17
2.함수 18
3.패키지 18
4.연산자 24


Chapter02데이터전처리와탐색적분석

제1절데이터유형과구조 29
1.데이터유형 29
2.데이터프레임구조 30
제2절데이터탐색 31
1.데이터로딩 31
2.데이터파악 33
제3절데이터정제 37
1.이상치와결측치처리 37
2.데이터스케일링 49

Chapter03통계이론

제1절통계의기본개념 57
1.통계개요 57
2.전수조사와표본조사 59
3.집단특성지표 60
제2절주요확률분포 68
1.정규분포 69
2.t분포 73
3.χ²분포 74
4.F분포 75
제3절통계적추론 76
1.추정 76
2.가설검정 77


Chapter04전통적통계기반분석기법

제1절빈도의비율차이분석 91
1.교차분석 91
2.Fisher의정확성검정 100
제2절평균차이분석Ⅰ:t검정 106
1.단일표본t검정 108
2.대응표본t검정 116
3.독립표본t검정 124
제3절평균차이분석Ⅱ:분산분석 136
1.일원분산분석 137
2.이원분산분석 151
3.반복측정분산분석 166
제4절상관분석 180
1.데이터불러와확인 181
2.상관분석실시 184
3.상관분석결과표현 187
제5절회귀분석 189
1.단순선형회귀 191
2.다중선형회귀 218
3.로지스틱회귀 243


Chapter05머신러닝기반분석기법

제1절머신러닝개요 261
1.개념 261
2.활용방식 262
3.주요기법 263
4.분석절차 265
5.데이터분할방법 266
6.모델성능평가 269
7.예제데이터 274
제2절전통적모델 277
1.K-최근접이웃 277
2.결정트리 291
3.서포트벡터머신 300
제3절앙상블모델 311
1.배깅결정트리 311
2.랜덤포레스트 323
3.GradientBoostingMachine 332
4.XGBoost 345
제4절신경망모델 361
1.인공신경망 361
2.심층신경망 375
제5절성능평가결과 410