데이터분석에서머신러닝까지50가지핵심개념
파이썬과R코드를실행해보며,필요한만큼만배운다!
많은데이터과학자가통계개념을이해하지못해한계에부딪힌다.문제가조금만복잡해도어디서부터어떻게해결해야할지몰라당황하거나,출력한결과를이해하지못해난감해하기일쑤다.이책은통계지식에목마른현업데이터과학자와인공지능개발자를위해쓰였다.목표는다음두가지다.
첫째,데이터과학과관련된통계의핵심개념을소화하기쉽고따라하기쉽게소개한다.
둘째,데이터과학의관점에서어떤개념이정말중요하고유용한지,어떤개념이덜중요한지구분해알게한다.
EDA,표본분포,유의성검정,회귀분석,분류,통계적머신러닝,비지도학습등오늘날데이터분석과머신러닝분야에서널리사용하는주제로구성했고,데이터과학자가꼭알아야하는개념을50여가지만‘콕’집어정리했다.자유도,p값,상관계수등고전통계에서중요하게생각하는개념중,빅데이터를다루는데이터과학자가세부사항까지자세히알필요가없는것은그에맞게안내한다.주요절마다‘용어정리’와‘주요개념’을정리해학습편의를높이고,같은용어라도통계학,데이터과학,컴퓨터과학에서저마다다르게쓰는경우에는그차이점을정리했다.
2판의가장큰특징은새로제공하는파이썬코드다.파이썬코드를싣기위해과학계산과데이터과학분야에서30년이상의경력을갖춘저자가새로투입됐다.파이썬이나R,둘중하나만다룰줄알아도책의내용을이해하고코드를실행해볼수있다.모두다룰줄안다면두언어간의구현차이를비교하는재미가쏠쏠할것이다.
일반인대상의통계책은시시하고전공수준의통계학교과서는어려워엄두가안난다면,이책을징검다리삼아통계지식과통계적사고력을키워보길바란다.누구든이책을끝까지잘마치면,필요한이론을적재적소에잘활용하는실력있는데이터과학자로거듭날수있다.
주요내용
● 데이터과학의초석인탐색적데이터분석시작하기
● 임의표본추출로편향을줄이고고품질데이터셋을얻는방법
● 실험설계원칙을적용해타당한결론을도출하고명확한답을찾는방법
● 회귀분석으로결과를추정하고이상을탐지하는방법
● 범주를예측하고찾아내는주요분류기법
● 데이터로학습하는통계적머신러닝기법
● 레이블없는데이터에서의미를추출하는비지도학습기법