데이터 과학을 위한 통계 : 데이터 분석에서 머신러닝까지 파이썬과 R로 살펴보는 50가지 핵심 개념 (2판)

데이터 과학을 위한 통계 : 데이터 분석에서 머신러닝까지 파이썬과 R로 살펴보는 50가지 핵심 개념 (2판)

$34.00
Description
파이썬과 R로 필요한 만큼만 배우는 실용주의 통계학
통계 기법은 데이터 과학의 핵심이지만, 데이터 과학자가 고전 통계를 낱낱이 알아야 하는 것은 아니다. 이 책은 데이터 과학의 관점에서 통계 핵심 개념과 기법을 필요한 것만 골라 소개한다. 50가지 개념을 차근차근 정리하고 코드를 실행해보면, 필수 통계 지식을 빠르게 흡수할 수 있다. 2판에는 기존 R 코드와 호응하는 파이썬 코드를 새롭게 추가했다. 이 책으로 필요한 이론을 적재적소에 잘 활용하는 실력 있는 데이터 과학자로 거듭나길 바란다.

저자

피터브루스,앤드루브루스,피터게데크

저자:피터브루스PeterBruce
통계교육기관Statistics.com설립자.Statistics.com은100여개통계강의를제공하며그중3할은데이터과학자가대상이다.치밀한마케팅전략을수립해최고수준의전문데이터과학자들을강사로모집해왔다.이과정에서데이터과학자를위한통계라는주제에대해폭넓은시야와전문적식견을쌓았다.

저자:앤드루브루스AndrewBruce
데이터과학실무전문가.30년이상학계,정부,기업계에서통계학과데이터과학을연구했다.워싱턴대학교에서통계학박사학위를땄고학술지에여러논문을발표했다.저명한금융회사부터인터넷스타트업에이르기까지업계에서발생하는폭넓은문제에대해통계기반솔루션을개발했고,데이터과학의실무활용측면에서전문가로인정받고있다.

저자:피터게데크PeterGedeck
데이터과학자.과학계산과데이터과학분야에서30년이상의경험을가지고있다.노바티스(Novartis)에서계산화학자로20년동안근무했고,현재컬래버레이티브드러그디스커버리(CollaborativeDrugDiscovery)에서선임데이터과학자로근무하며약물후보물질의생물학적,물리화학적특성을예측하기위한머신러닝알고리즘을개발하는일을전문적으로한다.『DataMiningforBusinessAnalytics』(Wiley,2019)의공동저자이다.프리드리히알렉산더대학교에서화학박사학위를받았으며독일하겐통신대학교(FernuniversitatinHagen)에서수학을전공했다.

역자:이준용
인공지능과빅데이터기술에관심이많은연구원.한국과학기술원(KAIST)에서전자공학박사학위를받고,일본ATRIRC연구소에서인간-로봇상호작용연구에참여했으며,미국아이오와주립대학교에서대사회로관련데이터베이스를구축하는일을했다.현재미국퍼시픽노스웨스트국립연구소에서일한다.다양한프로그래밍언어로데이터과학실무경력을쌓고있다.역서로『손에잡히는R프로그래밍』(한빛미디어,2015)과『파이썬과대스크를활용한고성능데이터분석』(한빛미디어,2020)이있다.

목차

CHAPTER1탐색적데이터분석
1.1정형화된데이터의요소
1.2테이블데이터
1.3위치추정
1.4변이추정
1.5데이터분포탐색하기
1.6이진데이터와범주데이터탐색하기
1.7상관관계
1.8두개이상의변수탐색하기
1.9마치며

CHAPTER2데이터와표본분포
2.1임의표본추출과표본편향
2.2선택편향
2.3통계학에서의표본분포
2.4부트스트랩
2.5신뢰구간
2.6정규분포
2.7긴꼬리분포
2.8스튜던트의t분포
2.9이항분포
2.10카이제곱분포
2.11F분포
2.12푸아송분포와그외관련분포들
2.13마치며

CHAPTER3통계적실험과유의성검정
3.1A/B검정
3.2가설검정
3.3재표본추출
3.4통계적유의성과p값
3.5t검정
3.6다중검정
3.7자유도
3.8분산분석
3.9카이제곱검정
3.10멀티암드밴딧알고리즘
3.11검정력과표본크기
3.12마치며

CHAPTER4회귀와예측
4.1단순선형회귀
4.2다중선형회귀
4.3회귀를이용한예측
4.4회귀에서의요인변수
4.5회귀방정식해석
4.6회귀진단
4.7다항회귀와스플라인회귀
4.8마치며

CHAPTER5분류
5.1나이브베이즈
5.2판별분석
5.3로지스틱회귀
5.4분류모델평가하기
5.5불균형데이터다루기
5.6마치며

CHAPTER6통계적머신러닝
6.1k-최근접이웃
6.2트리모델
6.3배깅과랜덤포레스트
6.4부스팅
6.5마치며

CHAPTER7비지도학습
7.1주성분분석
7.2k-평균클러스터링
7.3계층적클러스터링
7.4모델기반클러스터링
7.5스케일링과범주형변수
7.6마치며

출판사 서평

데이터분석에서머신러닝까지50가지핵심개념
파이썬과R코드를실행해보며,필요한만큼만배운다!

많은데이터과학자가통계개념을이해하지못해한계에부딪힌다.문제가조금만복잡해도어디서부터어떻게해결해야할지몰라당황하거나,출력한결과를이해하지못해난감해하기일쑤다.이책은통계지식에목마른현업데이터과학자와인공지능개발자를위해쓰였다.목표는다음두가지다.
첫째,데이터과학과관련된통계의핵심개념을소화하기쉽고따라하기쉽게소개한다.
둘째,데이터과학의관점에서어떤개념이정말중요하고유용한지,어떤개념이덜중요한지구분해알게한다.

EDA,표본분포,유의성검정,회귀분석,분류,통계적머신러닝,비지도학습등오늘날데이터분석과머신러닝분야에서널리사용하는주제로구성했고,데이터과학자가꼭알아야하는개념을50여가지만‘콕’집어정리했다.자유도,p값,상관계수등고전통계에서중요하게생각하는개념중,빅데이터를다루는데이터과학자가세부사항까지자세히알필요가없는것은그에맞게안내한다.주요절마다‘용어정리’와‘주요개념’을정리해학습편의를높이고,같은용어라도통계학,데이터과학,컴퓨터과학에서저마다다르게쓰는경우에는그차이점을정리했다.

2판의가장큰특징은새로제공하는파이썬코드다.파이썬코드를싣기위해과학계산과데이터과학분야에서30년이상의경력을갖춘저자가새로투입됐다.파이썬이나R,둘중하나만다룰줄알아도책의내용을이해하고코드를실행해볼수있다.모두다룰줄안다면두언어간의구현차이를비교하는재미가쏠쏠할것이다.

일반인대상의통계책은시시하고전공수준의통계학교과서는어려워엄두가안난다면,이책을징검다리삼아통계지식과통계적사고력을키워보길바란다.누구든이책을끝까지잘마치면,필요한이론을적재적소에잘활용하는실력있는데이터과학자로거듭날수있다.

주요내용
● 데이터과학의초석인탐색적데이터분석시작하기
● 임의표본추출로편향을줄이고고품질데이터셋을얻는방법
● 실험설계원칙을적용해타당한결론을도출하고명확한답을찾는방법
● 회귀분석으로결과를추정하고이상을탐지하는방법
● 범주를예측하고찾아내는주요분류기법
● 데이터로학습하는통계적머신러닝기법
● 레이블없는데이터에서의미를추출하는비지도학습기법