통계학 초 입문 (모든 것을 통계학으로 해석한다!)

통계학 초 입문 (모든 것을 통계학으로 해석한다!)

$13.70
Description
‘통계학’이 뭐지?
― ‘돈’과 ‘노동력’의 낭비를 막는다!
통계학은 예부터 우리 실생활 곳곳에서 활용된다.
젊은 세대가 앞으로 ‘무엇을 배워야 하느냐’고 묻는다면 저자는 다음 3가지를 꼽았다. 바로 어학과 회계학, 수학이다. 특히 요즘은 수학 중에서도 ‘통계학’이 주목받는 추세다. 인터넷 활용이 당연시된 이 시대에 방대한 자료를 수집하기란 식은 죽 먹기이지만, 그 자료를 처리하고 정리 그리고 이해하려면 통계학이 필요하다는 사실을 깨달았기 때문이다. 통계학은 어렵다. 하지만 통계학은 우리 생활 곳곳에 존재한다. 시청률이나 출구조사의 원리를 이해하는 것은 통계학 중 난이도가 높은 부분을 건드리지 않아도 가능하다. 통계학의 기초 단계조차 제대로 이해하는 사람이 그리 많지 않다. 아니 통계학을 어느 정도 안다고 생각하지만 사실은 그것을 써먹지 못하는 사람이 너무 많다. 저자는 이 책을 선택한 독자들이 ‘안다고’ 착각하는 상태에 머무르지 않기를 바란다고 했다. 그래서 이렇게 생각했다. 통계학의 기초라고도 할 수 없는 초보 중의 초보, 그 맛을 살짝 핥아보는 수준만 되새김질하며 하나하나 친절하게 설명하기로 했다. 중학교 수학을 제대로 이해하고 있다면 간신히 알 수 있는 범위만 다루기로 한 것이다.
그러므로 이 책을 읽으면 누구나 통계학을 활용할 수 있다는 말은 절대로 할 수 없다. 이 책은 통계학 입문서를 읽었지만, 그 내용을 이해하지 못한 사람을 대상으로 썼다. 통계의 초보 중의 초보라는 아무도 해보지 않은 일에 도전했다. 이 책의 내용을 이해한 다음에는 어떤 통계 입문서도 끝까지 읽을 수 있을 것이다. 초보 중의 초보 수준이지만 진지하게 그 방법을 익히면 당신은 통계학이라는 무기를 장착하게 될 것이다. 그렇게 되리라 믿고 이 책을 끝까지 읽어나가길 바란다.
저자

다카하시요이치

동경대학교이학부수학과·경제학부경제학과를졸업한후,박사학위(정책연구)를취득하고1980년에대장성에입성했다.대장성이재국자금기획실장과프린스턴대학교객원연구원,내각부참사관,내각참사관등을역임했다.
고이즈미내각과제1차아베내각의브레인으로활약하고2008년에퇴임했다.현재는가에쓰대학교비즈니스창조학부교수와주식회사정책공방대표이사회장을맡고있다.
저서로《한심한외교론》《한심한경제론》《도해피케티입문》《전쟁의역사를통해배우는지정학》《99%의일본인이모르는국채의진실》《화이부실시진핑의중국몽》《잘있어라,재무성!:관료모두를적으로돌린사내의고백》등다수의베스트셀러가있다.

목차

프롤로그
‘통계학’이뭐지?―‘돈’과‘노동력’의낭비를막는다!

통계학에대해사람들이‘오해하는것’
전부를조사하지않아도전체상을어느정도알수있다
통계학은‘편향되지않을것’이전제
편향된데이터가필요할때도있다
무작위는의외로어렵다
과부족없이하기도어렵다

1장히스토그램,평균값,분산,표준편차
―‘통계학’은여기서부터시작하자!

가장대중적인통계학‘히스토그램’
누구나할수있는주사위히스토그램
‘도수’와‘계급값’이란무엇인가
평균값,분산을계산해보자
통계학에서‘평균값’을구하는방법
데이터가퍼진상태를나타내는‘분산’
직접적인수치를나타내는표준편차
편찻값을계산하는방법을알고있나?
편찻값이무엇일까?
편찻값을계산해보자
표준편차로편찻값이오른다?내린다?
단한번의시험으로학력을측정할수는없다

2장정규분포
―가장대중적인‘분포의왕’

‘정규분포’란무엇일까?
좌우대칭의산처럼생긴그래프
어떤데이터가정규분포를그리는가
평균값과분산이중요한이유
가우스가증명한표준정규분포
‘오차’란무엇인가
표준정규분포는왜특별한가
데이터를‘정규화’한다
정규분포가통계학을수월하게하는이유
통계학은먼저‘가정’을한다

3장이항분포
―세상의‘온갖현상’이여기에있다

이항분포란무엇인가?
이항분포는확률분포의일종이다
이항분포를이해하기위한전제‘조합’
‘조합’과‘순열’을알아보자
‘조합’이란?
순열이란?
조합은‘중복’,순열은‘별개’라고생각한다
수학은공식을몰라도풀수있다
주사위를이용해서이항분포를이해하자
베르누이시행이란무엇인가
여러가지값의범위‘확률변수’
주사위로해석하는‘이항분포’
이항분포정리식을이해하자

4장정규분포와이항분포
―중요한아두분포는어떤관계인가?

통째로외우면좋은‘중심극한정리’
‘중심극한정리’란무엇인가?
중심극한정리와이항분포
‘숫자3개’로그래프를이해한다
이항분포의‘평균’과‘분산’
정규분포의특징은이항분포에도적용된다

5장시청률?출구조사의원리
―세상의수수께끼를통계학으로해명한다

총세대수5800만
8400분의1의샘플로어떻게시청률을알수있는가
시청률은정말로정확할까?
역시무작위는어렵다
시청률에는±2%의오차가있다
시청률의‘평균값’과‘분산’
왜샘플이90세대분이면안되는가
선거출구조사로어떻게당선확정을알수있는가
출구조사란무엇인가
후보가3명인선거구의경우
출구조사결과에서알수있는내용
‘무작위’가전제조건이다
통계학을배우기만하고끝이면안된다

후기

출판사 서평

우리는아직통계학의문앞에있다.
수학문제가풀렸을때느끼는짜릿한쾌감이좋다.
이세상의원리와돈의흐름,사람들의행동을숫자와공식으로표현할수있다.수학은즐겁고아름다운분야다.하지만세상에는수학을싫어하는사람이많다.공식을보면지레겁을먹고숫자가나열되면‘하나도모르겠다’고말한다.그렇게숫자를싫어하는사람들이통계학에대해알고싶을때,무엇을어떻게전하면통계학일부라도알게할수있을지고민하면서이책을썼다.숫자를보고의욕을잃지않도록공식을이해할수없어서통계학배우기를포기하지않도록정말하나하나곱씹어가며설명했다.독자여러분의정신을어지럽히는수학적표현이나기호도최소한도로기재했다.이책을다읽은여러분은지금통계학이라는학문의문앞에서문고리를잡고서있는상황이다.아직우리는입구에있는것이다.그문을열면미지의세계를예측하거나아직보이지않는미래를상정할수있는아름다운세상이펼쳐진다.그러나그아름다움을이해하려면수학을알아야한다.수학과마주할각오가있다면,그문을열고들어가자.좌절할때도많겠지만그래도얻는것이있을것이다.각오가서지않는다면여기까지만하자.그래도충분하다.나는‘이유를모르겠다’며포기하는것을좋아하지않는다.하지만수학만큼은예외다.모르는사람은모르기때문이다.수학은어느정도재능이필요한분야이다.‘모르겠다’는현실을받아들이는것도중요하다.

전부를조사하지않아도
전체상을어느정도알수있다.
전수조사를하지않아도샘플수가많으면실제시청률을알수있을까?샘플수만충분하면통계학을이용해서전체상을완벽하게파악할수있을까?엄밀하게말하자면그렇지않다.샘플조사와전수조사에는아무리해도차이가생기기때문이다.그차이를0으로할수는없다.그러나통계학을이용하면,“이정도로샘플을모으면실제값과±1%차이가난다.”“이정도로샘플을모으면실제값은99%범위안에들어간다.”이정도의차를알수있다.
다시말해전수조사를하지않고약간의샘플데이터만있으면전수조사한결과와거의비슷한수치를산출할수있다.이것이통계학이다.그러면한번생각해보자.1800만세대분의데이터를모은경우와겨우900세대분만모은경우,각기계산해서도출한결과값이거의같았다면?1000세대를조사한경우와900세대를조사한경우의시청률차이를비교해봤더니거의차이가없었다면?굳이돈과노동력을들여가며방대한데이터를모을필요가없다.그것은낭비다.통계학은‘이낭비’를깔끔하게제거해준다.

공식은외우지않아도된다.
그대신공식을이해해야한다.
히스토그램,평균값,분산,표준편차,정규분포,이항분포,중심극한정리…….이책에는여러가지통계학용어가등장했지만,그것을외우지못하겠으면잊어버려도된다.사실통계학,나아가수학공식이나용어는일상생활과전혀상관이없으므로시간이지나면당연히잊어버린다.잊어버릴줄알면서도그래도외우려고하는사람은내용을이해하지못하니까통째로외우려는것뿐이다.그모습이얼마나어리석은지깨닫지못한다.이것은사실생각하지않는행위나마찬가지인데말이다.생각하는능력은기억력과다르다.기억은시간이지날수록희미해지지만생각은우리가살아있는한영구히이어진다.특히수학적사고는보편적이고우리생활에널리적용할수있다.수집한데이터를분석할때‘분산’이라는전문용어가나오지않아도,공식을잊어버렸어도,‘평균에서벗어난데이터가많으면데이터는들쭉날쭉퍼진모양이된다’라고이해하면된다.그것을이해하면‘데이터와평균값의차이’가데이터가퍼진정도를생각할때필요한요소라는점도알수있다.생각하면된다.적어봐야알수있다면,적어보면된다.이책에서여러번‘직접써보면된다’고한것은종이에적으면이해할수있기때문이다.공식을통째로외우기위해서가아니다.
통계학은‘편향되지않을것’이전제이다.

통계학은적은비용과노동력으로거의정확한전체상을파악할수있다.그런데‘거의정확한’결과를도출할수있는지는샘플을선택하는방법에달려있다.예를들어시청률조사를할때,그집에서사는사람이어느방송을보는지는연령대나가족구성에따라다르기마련이다.그런데샘플대상을20대젊은이만수집하거나70대이상인고령자만수집하면편향된결과가나올것이다.즉,샘플이편향되면정확한결과를낼수없다는말이다.그러므로통계학자는편향되지않은샘플을추출하는것을무엇보다도중시한다.