3일 만에 끝내는 코딩 통계 (R언어 설치부터 코딩까지)

3일 만에 끝내는 코딩 통계 (R언어 설치부터 코딩까지)

$15.69
Description
통계와 코딩은 이제 현대인의 기초 소양이 되었다. 이 책은 코딩 초보자, 통계 비전문가를 위한 입문서로서, 3일 만에 코딩과 통계의 감을 잡을 수 있도록 해준다. 사용하기 쉽고 통계에 최적화된 R 언어를 설치하는 것(1장)부터 차근차근 알려준다. 그리고 고등학교 때 배운 순열과 조합(2장)부터 시작해 확률(3장), 조건부확률(4장), 확률분포(5장), 통계적 추정(6장)까지 따라가며 통계를 코딩으로 함께 풀어본다. 몇 줄의 코드를 직접 입력하고 실행해보면서 통계적 개념을 명확히 알게 되고 코딩까지 자연스럽게 익힐 수 있게 될 것이다. 여기에 더해 컴퓨터 성능이 고도로 발달한 시대의 통계 기법인 부트스트랩(7장)까지 맛보고 나면, 통계와 코딩이 불가분의 관계라는 것을 더욱 실감할 것이다. 그리고 이후 더 공부해보려는 독자들을 위해서 넓고 깊은 통계학의 세계를 안내하는 지도(8장)가 마련돼 있다.
저자

박준석

서울대학교에서심리학학사,석사학위를취득하고미국으로건너가오하이오주립대학에서통계학석사학위와계량심리학박사학위를취득했다.졸업후에는산업현장으로진출하여미국서부해안에서데이터과학자로일하고있다.페이스북페이지〈오하이오의낚시꾼〉을통해대중에통계학과데이터과학을소개하고있으며,대중의데이터문해력증진및통계학대중화에관심이많다.
저서로는사람들이왜가짜뉴스를믿게되는지를심리학적으로고찰한『가짜뉴스의심리학』,관련전문가들과함께데이터과학및산업의현재를조망한공저『데이터과학자의일』이있다.

목차

들어가며

01R설치및사용법
왜R언어인가|R설치방법
■어떤도구로통계학을배울것인가

02경우의수,순열,조합
코딩으로확률과통계시작하기|R에서변수사용하기|팩토리얼을구하는코드짜기|함수만들기|R로순열구하기|R로조합계산하기|프로그래밍으로확률과통계를공부하는이유
■상트페테르부르크의역설

03확률
확률은경우의수세기|용어|수학적확률|통계적확률|극한의의미|큰수의법칙|큰수의법칙은돈이된다|수학적확률로확률문제풀기|통계적확률로문제풀기:시뮬레이션|R과몬테카를로시뮬레이션으로확률문제풀기|몬테카를로방법으로원주율계산하기|몬티홀문제
■심슨의역설

04조건부확률
조건부확률이란|베이즈정리|조건부확률시뮬레이션하기|베이즈정리시뮬레이션하기:코로나19검사
■생일역설:왜드물게보이는사건은꼭일어나곤하는가

05확률분포
확률분포란|이산확률변수와연속확률변수|R로이산확률분포시뮬레이션하기:로또복권|가장대표적인연속확률분포,정규분포|R로정규분포다루기|중심극한정리|중심극한정리는(거의)모든분포에적용된다
■아들/딸역설

06통계적추정
통계적추정이란|통계적추정의종류|모평균의추정|표본평균시뮬레이션하기|모평균에대한구간추정|R로95%신뢰구간의성질확인하기|컴퓨터시대의무식한(?)추정방식
■예측정확도의역설

07부트스트랩
컴퓨터시대의통계학|부트스트랩의원리|부트스트랩으로모평균추정하기|부트스트랩으로모표준편차추정하기|통계적가설검정|부트스트랩신뢰구간을활용한가설검정|다시컴퓨터시대의통계학
■확률의세계와인간의편향

08통계학의지도
통계학에좀더관심있는분들을위해|통계학공부의‘테크트리’|통계학의분야들|데이터과학과통계학
■통계학과기계학습,비슷하면서도서로다른

나오며
찾아보기
저자소개

출판사 서평

겁먹지않아도되는코딩·통계입문서

이책은통계입문자,코딩초보자들을위한가장간편하고확실한입문서이다.이책을읽고나면왜통계를코딩과함께배워야하는지,그리고컴퓨터에게일을시키는수단으로서코딩이무엇인지확실히감을잡을수있을것이다.두꺼운전공서나교재를보고작심삼일이될까선뜻손이가지않았던이들이라도이책이라면문제없다.3일만에읽어내고나면숫자와코드에대한막연한겁이없어질것이다.

빅데이터활용과인공지능의눈부신발전은현대인에게새로운기초소양을요구하고있다.코딩과통계가그것이다.하지만코딩의세계는넓고,통계학의세계는깊다.본격적으로배우려면만만치않은분야이다.심리학과통계학을전공하고현재데이터과학자로일하고있는저자는대중의통계문해력증진에관심이많다.저자는페이스북페이지〈오하이오의낚시꾼〉을운영하며많은사람이통계에대해부정확하게알고있거나오해하는경우가많다는것을알게되었다.저자는실제통계활용법과는거리가있는고등학교통계교육부터개선될필요가있다고말한다.현대의통계는컴퓨터활용과불가분의관계에있고,코딩을통해통계를익히고이해하는것이훨씬효과적이고유용하다는것이저자의생각이다.

코딩없이통계를배웠다고?

학교에서배웠던〈확률과통계〉는우리에게얼마나도움이될까?수업에선수식을외우고손으로써가며경우의수를계산하고평균을도출하곤했었다.하지만교과서의예들처럼말끔한숫자로정리된데이터가아닌,혼란스럽고거대한현실의데이터를마주쳤을때도그렇게할수있을까?게다가빅데이터의시대,손계산은물론이고탁상용계산기로도그렇게직접계산할수는없다.그래서실제통계작업은컴퓨터를활용해야만한다.그리고컴퓨터에게일을시키는수단이바로프로그래밍,즉코딩이다.
가장간단한것부터코드로구현해보자

코딩은어려울까?어렵기도하고쉽기도하다.복잡한기능을지닌상업용프로그램을만들어야한다면매우어려울것이다.하지만목적이통계처리라면그렇게어렵지않다.통계적활용에최적화된쉽고간편한프로그래밍언어R이있다.쉽게익힐수있는언어로각광을받고있는파이선보다도더쉽다.이책에선R언어패키지를어디서받아서어떻게설치해야하는지부터친절하게설명하고있다.

이책의코딩은가장간단한것,모두알고있는것부터시작한다.예를들어,10!(10팩토리얼)을계산하는걸코딩으로어떻게구현할까?다음과같은몇줄의코드로컴퓨터에게그계산을시킬수있다.

x〈-1
for(iin2:10){
x〈-x*i
}
x

대부분의프로그래밍입문서를사보면처음에변수유형이나연산자부터배우게될것이다.이책에서는그보다는바로코딩의맛을보며익숙해지도록이끈다.3일만에코딩과통계입문을끝낼수있는비법이바로여기에있다.

컴퓨터에게동전던지기를시켜보자

확률에대한가장직관적인이해가무엇일까?시행을무한히반복할때수렴하는값이다.동전을열번던지면앞면이더많이나올수도있다.하지만백번천번던진다면?많이던질수록전체시행중앞면이나온경우는0.5에매우가까워질것이다.사람은앉아서수천번을던지고있을수없지만컴퓨터에게그런반복작업을시키는건식은죽먹기다.컴퓨터가결과를보여주고그래프까지그려준다.

우리는동전던지기의기댓값이1/2이라는걸이미알고있다.주사위를던졌을때6이나올확률이1/6이라는것도알고있다.그걸컴퓨터한테시켜보는게뭐대단한일이냐는생각이들수있다.하지만값을모른다면?알아도믿기지않는다면?

통계학에몬티홀문제라는아주유명한문제가있다.문제는이렇다.세개의문이있는데한문뒤에는자동차가있고,다른두문뒤에는염소가있다.참가자가자동차가있는문을고르면자동차를상으로받고,염소가있는문을고르면꽝이다.참가자가한문을선택하고난후진행자가다른두문중에서하나를열어서염소가있는걸보여준다.그러고나서묻는다.지금선택한문을고수하시겠습니까,다른문으로바꾸겠습니까?과연무엇이옳은선택일까?

많은이들이선택을고수하든바꾸든확률은1/3로똑같다고생각한다.하지만바꾸는게더유리하다.왜그런지말로설명을들어도잘이해되지않을수있다.그럴때컴퓨터에게수천번의시행을시켜보면차이를확실감하게된다.몬티홀문제의상황을코딩한후문을바꾼경우와바꾸지않은경우의상을타는횟수가어떻게나오는지비교할수있는것이다.이걸해보는데필요한코드는스무줄도안된다.

통계학과빅데이터의세계로

이책은아주기초적인주제들만다루고있다.하지만통계학과빅데이터의세계로들어서는데가장적합한입문서가될수있다.통계가이렇게코딩으로돌아가는구나,감을잡는데최적화되어있다.저자는통계학과계량심리학을전공해직접코드를짜가며여러데이터를처리해본경험이풍부하다.현재는데이터과학자로서기업에서일하고있다.연구와실무를겸비한전문가의감각으로딱필요한핵심을알려준다.입문을넘어좀더관심이생기는독자에게는8장통계학의지도가이정표가될것이다.

한편매챕터끝에있는박스글은색다른재미와보석같은팁을제공한다.왜같은반에생일이같은친구가있는경우가많을까?통계학과기계학습은어떤관계일까?예측정확도가높은검사가꼭좋은검사일까?이런궁금증들이해소될것이다.