R 통계의 정석 : 메디컬 빅 데이터 연구를 위한 (양장)
저자

김종엽

저자:김종엽
전공은이비인후과이나현재는의과대학정보의학교실주임교수로서연구에더많은시간을할애하고있다.2009년‘깜신의작은진료소’라는블로그를개설한것을계기로‘깜신’이라는닉네임으로방송및집필활동을꾸준히해오고있다.저서로는『의사아빠깜신의육아시크릿』,『꽃중년프로젝트』,『코사용설명서』(공저),『꽃보다군인』(공저),『닥터스블로그』(공저)등이있다.유튜브채널「나는의사다」에서메인MC로출연하고있으며,건양대학교병원에서는헬스케어데이터사이언스센터센터장으로의료정보표준화와의료인공지능개발을통한정밀의료구현에힘쓰고있다.

목차

들어가는글 5
1강통계작업을염두에둔엑셀파일만들기 11
2강엑셀을CSV파일로변환해서RStudio로불러오기 17
3강두그룹의평균을비교하기 29
4강세그룹이상의평균을비교하는방법 45
5강여러그룹에서그룹간평균비교하기(사후검정) 63
6강그룹간의비율을비교하기 77
7강모자이크&막대그래프따라하기 95
8강짝을이룬데이터분석개념잡기 117
9강동일대상또는매칭된대상에서A약과B약의효과,
치료전후의결과비교하기 125
10강동일대상또는매칭된(셋이상의)대상에서
치료1,2,3개월후의결과비교하기 139
11강상관분석알아보기 177
12강단순회귀분석알아보기 187
13강회귀모형을받아들이기위한기본가정 195
14강다중회귀분석 211
15강로지스틱회귀분석 239
16강푸아송회귀분석 263
17강생존분석 277
부록1파일경로마스터하기 299
부록2상대위험도와교차비의차이 311
더읽을거리 317
찾아보기 319

출판사 서평

쉬는시간마다코딩하던의사,
AI와빅데이터전문가가되다.
그러나‘데이터가서말이라도꿰어야보배’란업계의격언처럼방대하게수집된데이터를활용하기위해서는자료관리기술과분석기술이필수적으로요구된다.인공지능의도움을받는다고해도무엇을분석할지를결정하는것은결국사람이므로,바야흐로의사가메스뿐만아니라컴퓨터도잘다루어야하는시대가열린것이다.이를실천하고있는사람이바로김종엽건양대학교의과대학교수다.우리에게600만방문자를돌파한의학상식블로그‘깜신의작은진료소’의운영자나SBS‘자기야’,유튜브채널「나는의사다」같은방송에출연했던모습으로더익숙할수있으나,사실김종엽교수는과학고등학교시절부터컴퓨터코딩을취미로즐겼던특이한이력의소유자였다.
의료와IT(정보통신)기술의융합이화두로떠오르던2018년그는건양대학교에서정보의학교실을처음으로개설해초대주임교수를맡았고,2019년에는헬스케어데이터사이언스센터를개설해병원에서만들어지는의료데이터를비식별화(익명화)하고외부에공개했다.의료데이터의연구적활용가능성을높이고의료인공지능발전및인프라조성에기여한이공로를인정받아,김종엽교수는2021년1월과학기술정보통신부장관상을받기에이른다.이뿐만아니라그는최근보건복지부와DNA(데이터·네트워크·인공지능)중장기국가전략및실행계획을수립하고대통령직속4차산업혁명위원회에서디지털헬스케어특별위원회위원을맡기도하는등,그야말로대한민국을선도하는AI와메디컬빅데이터전문가로서활약을펼치고있다.

빅데이터연구를꿈꾸는초보연구자를위한
김종엽교수의R통계분석안내서
2021년하반기사이언스북스신간으로출간되는『R통계의정석』은김종엽교수가이처럼빅데이터연구의권위자로서,빅데이터의올바른활용을위해선결되어야만하는프로그래밍언어R의사용법을자신의유튜브채널에서3년간강의한내용과,건양대학교의과대학학생들에게진행한수업내용을책으로엮은결과물이다.
컴퓨터에익숙하지않은의과대학생을대상으로한이수업에서,그는작업전원자료를정리하고오류를줄이는과정부터R에데이터를불러오는방법,R을활용해그래프를생성하고상관분석,푸아송분석,생존분석같은각종분석을하는방법까지메디컬빅데이터연구에필요한모든과정을총17개의강의에녹여냈다.


R이란?
1993년뉴질랜드오클랜드대학교에서개발된,통계및그래프작업을위한프로그래밍언어이다.개인,기관,기업에서모두무료로사용가능한오픈소스프로그램인R은통계학자들이개발한만큼데이터분석에특화되어있다.전세계인이만들어공유한12,500여개의통계패키지설치를통한기능확장으로다양한통계기법적용과그래프작성을손쉽게할수있다.




『R통계의정석』만의강점
■실제연구과정에바로적용가능
연구자에겐자신의연구가설을확인하기위한통계방법을고르는일부터가큰난관이다.『R통계의정석』은그러한독자에게어떤통계방법을골라야하고,그이유는무엇인지를최대한쉽게설명할수있도록구성되었다.통계분석이급하게요구되는실전상황에서,자신의연구내용과맞는장을목차에서찾아바로도움을받을수있다.

■의학분야의R사용상황에특화
『R통계의정석』은일반적으로R을사용하려는모든사람이충분히활용할수도록쓰였지만,주로의학분야에서R을필요로하는상황에맞추어데이터를다루는기본적인기능뿐만아니라R의장점인통계그래픽을최대한활용할수있는실전적방법들을소개하고있다.책의후반부에는상관분석,다중회귀분석,푸아송분석,생존분석등보건의료통계에서R로수행하는분석을위주로친절한설명이이루어진다.

■강의내용을실습할수있는데이터세트와코드
사이언스북스도서페이지(sciencebooks.minumsa.com/book/1390)에서강의에서사용된데이터세트와코드의압축파일을제공한다.QR코드를통해도서페이지로들어가챕터별로정리된파일로강의속계산과그래프그리기를직접해볼수있다.

■강연영상으로저자와만나기
저자의유튜브채널(youtube.com/musezzang1)에‘깜신의통계왕초보탈출’이라는이름으로총44편의강의가업로드되어있다.책에소개된내용외에도통계분석에관심이있는독자라면많은도움을받을수있다.

책에나온표현대로,“이게무슨귀신씻나락까먹는소리냐.”싶어도일단그의말만믿고따라하다보면어느새R에익숙해지게되는『R통계의정석』.이책과함께라면,평생프로그래밍언어와의접점이라고는영화나드라마에서화면에뜨는정체불명의텍스트를본경험밖에없었던의대생(또는통계를활용해야만하는다른전공학생)이라도데이터를읽고,고품질그래프를그리고,데이터분석을하는능력이저절로생겨나며빅데이터연구를향한첫걸음을내딛는자신을발견할수있을것이다.


<추천사>
R을처음접하는연구자들을위한지침서

연구자들은연구를위해가설을세우고데이터를모으고통계를분석한다.통계분석을위해우리는여러통계소프트웨어를사용한다.대표적인통계소프트웨어에는SAS,SPSS,R등이있다.R은통계분석을위해탄생한언어이지만,컴퓨터언어라는측면에서도참매력적이다.하지만SPSS등에비교해R이갖는가장큰진입장벽은바로명령어를키보드로직접입력해야한다는점이다.자동차도자율주행을하는2021년인공지능시대에키보드로명령어코드를입력해야한다니시대에역행하는것같은생각도든다.

인공지능시대에도의사는존재할것이다.숙련된외과의사가암수술을한다고할때,필요한여러술기가있겠지만수술을하는의사는수술목적에맞게피부및연부조직을절개하고지혈하고암조직이있는장기를절제해내는과정이있고마지막으로절개된수술부위를봉합해야한다.훌륭한외과의사가되기위해서는의과대학학생시절과의사초년병시절에수없이봉합(suture)와결찰(tie)을연습해야하며이를인공지능이대신해주지않는다.연구에서통계분석은봉합,결찰과같다.처음배우기어렵고재미없고익숙해질때까지시간이걸리지만,한번익숙해지면더는그문제로시간과노력을투자하지않아도된다.

통계언어로서의R의인기상승과함께R을다룬책도정말많아졌다.김종엽교수가쓴『R통계의정석』은제목이이책의내용을잘설명해준다.나는어렸을때바둑의정석으로,고등학교때는수학의정석책으로수학을배운기억이있다.이책은R을처음공부하면서데이터를불러오고패키지를설치하고기본적인통계분석을하는과정을초보자입장에서쉽게따라할수있도록잘설명한책이다.아마도김종엽교수는R을처음접하는사람에게R강의를많이하면서R의초보자가어떤부분을어려워하는지알게되었을것이다.덕분에이책에서가장쉽게러닝커브(learningcurve)를극복할수있도록많은고민을한흔적이느껴진다.이책은R에입문해보고싶은데문턱이높아주저하는통계비전공자를위한책이다.외과수술에있어봉합과결찰과같이이책을보면서책의설명대로따라하다보면본격적인R사용자로발전하고있음을알게될것이다.



문건웅(가톨릭대학교순환기내과교수,
『의학논문작성을위한R통계와그래프』저자)