수학과통계학을가르치는명강사가
세상에서가장알기쉽게,깊이있게,재미있게정리한통계학입문서!
개념과핵심용어를만화로쉽게익힌다.
활용에중점을두고꼭필요한것만배운다.
기술통계학에서추론통계학까지한번에정리한다.
심도있는보충설명으로이해의폭을넓힌다.
게이토상사영업부에서일하다가느닷없이데이터분석부로발령받은에토게이타.통계를다루는부서라는정보만가지고데이터분석부의문을두드리는데….
이제부터게이타앞에숫자와기호,그래프등이가득한통계세상이펼쳐진다.시부야가즈미부장의안내로평균값,중앙값,최빈값이뭔지배우고표준편차,분산,산포도,회귀분석같은용어에도익숙해진다.여러데이터를비교하고분류하는방법,숫자를그래프로표현하는방법,엑셀로가설을검정하는방법등을차근차근알아가면서게이타는통계지식이비즈니스업무에어떤도움을주는지깨닫는다.그리고입사동기이자경쟁자인영업부의후미노리와함께주거래처전무의의사결정에결정적인도움을준다.이후영업부로복귀한게이타는가즈미부장의조언대로통계를업무에활용해큰성과를올린다.
이책은‘도대체통계란무엇일까?’하는게이타의물음으로시작해‘세상을이해하려면통계학이필수!’라는게이타의답으로끝난다.통계는세상을읽는도구다.그래서배우고알아야한다.‘알기쉽고,깊이있고,재미있고,충실한’이책으로통계세상에첫발을내딛기바란다.어떤책이든끝까지읽는게중요한데,생생한사례와흥미진진한통계이야기를읽다보면마지막책장까지순식간에달려갈것이다.
책속에서
통계학에서대푯값은여러개다
이책에는때때로복잡한수식이등장한다.이는통계용어를효율적으로표기하려는것이므로통계학을처음배울때통계용어를하나하나제대로이해하는것이중요하다.그렇다고난해한말은나오지않으니너무걱정하지않아도된다.맨처음배울용어는‘평균값’이다.
평균값의의미는무엇일까?많은사람이일상대화에서특별하게크지도작지도않은,맨가운데라는의미로사용할것이다.그러나평균값이데이터의중심을나타내는대푯값이라는말은실제로통계학에서사용하려할때는너무애매해서다양하게대푯값을규정할필요가있다.-30p
통계학은데이터값이얼마나흩어져있는지에주목한다
지금까지는데이터값의‘중심’에주목했는데,통계학에서는‘데이터가얼마나흩어져있는지’에도주목해야한다.‘무슨말인가’싶겠지만‘데이터값이평균값주변에어떤식으로분포되고또떨어져있는지’를알아내기위한것으로통계학에서는매우중요한개념이다.중심을나타내는지표를‘대푯값’,흩어진정도를나타내는지표를‘산포도(degreeofscattery)’라한다.대푯값이여러개였던것처럼산포도역시여러가지지표를가지고있다.산포도를나타내는지표를자세히살펴보기전에흩어진정도가무엇인지느껴보자.먼저표준편차부터보자.-54p
[극단값]극단값을제외하거나무시하지않고데이터를살핀다
상관계수를구할때는반드시산포도를그리자.그다음극단값이숨어있지는않은지,허위상관은없는지살핀다.통계학을활용할때는수학적으로계산하고수치를보고판단하는것에만중점을두지말고다양한요소를봐야한다.통계분석은현상을파악하고,회의자료를만들고,계획을세울때필요하다.객관적인분석으로논의의토대를만들고깊이검토할자료를제시할수있다.극단값을데이터에서주의할값으로남겨두는이유는그극단값주위에보이지않는층화가있을지모르기때문이다.관점이다른고객들,시장수요,그러한일부가극단값이되어떨어져있을가능성이있다.-138p
상관계수의계산식을읽어보자
이책에서는지금까지표준편차와공분산,상관계수를가능한수학기호를사용하지않고설명했다.‘통계학=수식=기호’라는이미지는통계학이어렵고전문적이라는벽을만들어버렸다.그래서통계학과아예담을쌓고사는사람들이많았다.그러나수식없이통계학을알아보면서두걸음혹은세걸음이나통계학의세계에발을내디뎠다.이제지금까지배운내용을되돌아보면서통계학의수식을공부해보자.여기서의수식은이미공부한내용을기호로나타낸것이다.수학기호는배운것을편리하게설명하기위한도구다.-157쪽
가설검정을사용해때로는위험한선택도한다
가설검정을잘하려면‘데이터를어디까지수집할수있을지’,‘유의수준을어떤식으로설정할지’가중요하다.그러나시간과노력을들여데이터를모아도그판단이항상참이라고할수는없다.또판단할때는‘확실하지만늦는것’과‘불확실하지만빠른것’으로나눠사용해야한다.‘문맥’과‘입장’,‘상황’을보고가설검정의결과를어떻게수용할지판단하자.
이익을얻기위해어느정도의위험이허용된다면유의수준을높게설정하고한정된데이터수로판단하는것도때로는필요하다.그러나의약품과식품등안전성이중요한사업에서는유의수준을낮게설정하고비용을들여서라도데이터수를충분히모아야한다.무엇을위해가설을검정하는지한번더생각하고엑셀을사용해p값을산출해보자.-201p
‘독립성검정’도적합도를검정하고있다
추론통계학의가설검정방법으로‘적합도검정’과‘독립성검정’을살펴보았다.둘다기대빈도표에가까운것인지조사하는검정이었다.‘적합도’는기댓값과기대빈도표와의적합정도를본다.한편‘독립성’은한그룹과또다른그룹의관련성과기댓값과관측값의적합정도를보고있다.결국독립성검정은적합도검정의일종이다.그렇다면독립성검정으로무엇을알수있을까?‘도시근교와교외,디자인A와디자인B가관련성이없는것은아니다’,‘검토의여지가있다’라고말할수있다.그러나‘디자인A가좋다’,‘교외에서는디자인B가효과적이다’라고하는회사내부의‘굳건한믿음’은사라졌다.대신논의할수있는토대를가설검정이제공할수있다.통계학은진실을알수있는것이아니다.토대를준비해논의를진행할수있도록돕는다.-216-217p