사회과학자를 위한 데이터과학 (R을 이용한 사회과학 자료분석)

사회과학자를 위한 데이터과학 (R을 이용한 사회과학 자료분석)

$36.75
Description
사회과학 연구자들이
“오류 가능성이 높은 자료분석 루틴”을 지양하고
21세기의 변화된 자료분석 환경에 걸맞는
새로운 사회과학 자료분석 루틴을 체득하도록 돕는다.
이 책은 21세기 사회과학 경험연구 방법을 새롭게 정립하기 위해 20세기 사회과학 경험연구 방법 중에서 핵심이 되는 내용을 정리하고 이를 베이지안 사회과학 방법론으로 종합하기 위한 논의를 전개했다. Part 1~3에서는 독립성을 검증하기 위한 분석으로부터 시작된 사회과학의 통계적 분석방법이 회귀분석과 일반선형모형, 그리고 최대 우도 추정을 거치면서 어떻게 하나의 통일된 체계를 갖추게 되었는지 살펴보았다. Part 4~5에서는 베이지안 방법의 기초와 추정방법에 대한 논의를 거쳐 은닉 마르코프 모형을 이용한 역사자료 분석방법을 소개했다. 은닉 마르코프 모형이 일반선형모형이나 패널모형, 네트워크모형과 결합하여 사회사적 과정의 구조적 변화를 설명하는 중요한 방법론적 도구가 될 수 있음을 밝혔다.
이 책에 등장한 모든 R코드는 저자의 깃허브(http://github.com/jongheepark/BayesianSocialScience/)에서 누구나 다운로드 받아서 직접 구현해 볼 수 있다. 책에 등장한 그래프와 테이블, 그리고 분석모형을 직접 하나씩 구현함으로써 독자들은 저자가 말하는 “사회과학자를 위한 데이터 과학”이 무엇인지를 직접 경험할 수 있다. 부록에 독자들이 이 책의 코드를 깃허브(http://github.com)에서 내려 받아 사용하는 방법을 소개한다.

스프레드 시트와 드랍다운 메뉴에 의존하는 자료분석은 치명적인 오류를 낳을 가능성이 매우 높다. R은 21세기의 새로운 자료분석 환경에 걸맞는 통합적 자료분석 플랫폼을 제공해 주는 뛰어난 통계 소프트웨어이다. 이 책은 사회과학자들이 R을 이용하여 21세기의 변화된 자료분석 환경에 걸맞는 새로운 자료분석 루틴을 체득하는 것을 돕기 위한 책이다.
이 책에서 말하는 21세기의 변화된 자료분석 환경이란 (1) 자료형태의 확대, 자료의 양적 증가, 자료처리 기술의 발전, (2) 모형의 복잡성과 다양성 증가, (3) 추정 방법의 다양화, 그리고 (4) 컴퓨터 연산 능력의 비약적 성장으로 요약할 수 있다. 저자는 지난 10여 년 동안 “사회과학자를 위한 데이터 과학이란 무엇인가?”를 고민해 왔으며 그 과정에서 느끼고 깨닫고 배운 바를 이 책에 정리하였다.
20세기 경험적 사회과학은 실험방법과 확률이론, 그리고 통계학을 수용하여 놀라운 성취를 이루었다. 21세기 경험적 사회과학이 자료분석 환경의 급격한 변화라는 도전을 과학성(scientificity) 향상의 기회로 만들 수 있을지는 전적으로 사회과학 경험연구자들의 손에 달려 있다고 볼 수 있다. 이 책은 그 도전의 길에 서 있는 사회과학자들에게 작은 안내서가 되고자 한다.
대학 수업 환경(수업시수)에 맞게 12장으로 구성했으며, 자료분석 도구로 R을 사용했다. 책에 등장하는 다양한 자료분석의 과정을 하나씩 따라가면서 분석모형을 구현해볼 수 있게 구성되어 있다. 정치외교학, 사회복지학, 사회학, 행정학, 심리학, 교육학 등 여러 사회과학 분야의 연구방법론 수업에 교재로 활용할 수 있다.
저자

박종희

서울대학교정치외교학부교수
서울대학교정치외교학부에서국제정치경제와사회과학방법론을가르치고있으며현재서울대학교국제문제연구소산하국제정치데이터센터장을맡고있다.서강대학교정치외교학과를졸업한뒤서울대학교외교학과에서석사를마치고미국워싱턴대학교(세인트루이스)에서무역보조금연구와베이지안방법론으로정치학박사학위를취득했다.2007년부터2012년까지미국시카고대학정치학과에서조교수로부임하며국제정치경제와정치학방법론을가르쳤으며미시간대학의ICPSR(2008-2012여름)에서베이지안방법론을가르쳤다.베이지안전환점모형에대한연구로2010년미국정치학회방법론분과최우수논문상인해롤드가즈넬상을수상했으며2013년에는MCMCpack으로미국정치학회방법론분과가수여하는통계소프트웨어상을수상하였다.주요방법론관련저작으로는“BayesianInferenceinPoliticalScience”(TheSAGEHandbookofResearchMethodsinPoliticalScienceandInternationalRelations),“DetectingStructuralChangesinLongitudinalNetworkData”(BayesianAnalysis2020),“BayesianApproachtoMultilayerStochasticBlockModelandNetworkChangepointDetection”(NetworkScience2017),“AUnifiedMethodforDynamicandCross-SectionalHeterogeneity:IntroducingHiddenMarkovPanelModels”(AmericanJournalofPoliticalScience)등이있다.

목차

서문

Part1자료분석의과학적기초

chapter01사회공학에서사회과학으로
제1절사회공학의탄생
제2절열광,희열,그리고공황
제3절맬더스트랩은존재하는가
제4절사회과학자료분석의세가지장
제5절21세기사회과학자료분석방법론58
요약|사회공학적연구로흐르지않기위해사회과학자료분석시에유의해야할점

chapter02확률
제1절확률의역사
제2절확률의전복
제3절확률이론
제4절순열
제5절조합
제6절확률변수
요약|확률

chapter03확률분포
제1절확률분포와자료생성과정
제2절이산확률분포
제3절연속확률분포
제4절중심극한정리
제5절확률분포의확장
요약|확률분포

Part2자료에서분석으로

chapter04독립성,연관성,그리고상관성
제1절연관성
제2절상관성
제3절생태학적오류와심슨의역설
요약|독립성,연관성,그리고상관성

chapter05회귀분석
제1절회귀분석이란무엇인가
제2절선형회귀분석의수학적기초:1차선형함수
제3절선형회귀모형의기본구조
제4절선형회귀모형의해석
제5절R을이용한골튼의신장유전회귀분석
요약|회귀분석

Part3통계적추론

chapter06선형회귀분석모형과최소제곱추정법
제1절최소제곱추정법이란무엇인가
제2절단순선형회귀모형
제3절다중선형회귀모형
제4절회귀분석모형의진단
제5절caret패키지를이용한선형회귀분석모형의교차타당성검증
제6절선형회귀분석은다른최적화방법에비해열등한분석방법인가
제7절종속변수와설명변수가뒤바뀌면결과가달라지는가
요약|최소제곱추정법

chapter07일반선형모형과최대우도추정법
제1절최대우도추정법을이용한통계적추론
제2절일반선형모형
제3절최대우도추정법을이용한일반선형모형의추정
요약|최대우도추정법

Part4베이지안사회과학방법론

chapter08베이지안통계학
제1절두개의봉투문제
제2절베이지안분석의구성요소
제3절베이즈정리
제4절사전확률분포에대한논쟁과드피네티의정리
제5절사회과학과베이지안분석
제6절베이지안사회과학방법론이란무엇인가
요약|베이지안통계학

chapter09베이지안분석방법
제1절켤레성
제2절마르코프체인몬테카를로방법
제3절메트로폴리스해이스팅스방법
제4절깁스추출
제5절자료증강법
제6절EM알고리듬
요약|베이지안분석방법

Part5분석방법의확장

chapter10역사의시간성과베이지안분석법
제1절사회과학과시간성
제2절정상시계열모형
제3절전환점모형
제4절은닉마르코프모형
제5절비균일은닉마르코프모형을이용한역사연구
요약|시간성과베이지안분석법391

chapter11베이지안전환점분석모형
제1절베이지안선형회귀분석전환점모형
제2절프로빗회귀분석전환점모형
제3절서수형프로빗회귀분석전환점모형
제4절푸아송회귀분석전환점모형
제5절패널회귀분석전환점모형
제6절기술적전환점분석과구조적전환점분석
요약|베이지안전환점분석모형

chapter12베이지안방법을이용한네트워크전환점분석
제1절네트워크란무엇인가
제2절네트워크시각화
제3절네트워크중심성분석
제4절네트워크전환점
제5절강대국동맹네트워크에대한응용
요약|베이지안방법을이용한네트워크전환점분석

chapter13결어

참고문헌487
찾아보기494
부록:깃허브코드이용하는방법

출판사 서평

책의구성과내용

『사회과학자를위한데이터과학:R을이용한사회과학자료분석』이데이터과학에대한일반적인책들과다른점은사회과학자료분석의본질적특징과데이터과학의최신연구방법이어떻게조화될수있을것인가에초점을두고있다는점이다.이를위해서이책은필요할때마다시간을거슬러올라가19세기와20세기동안새로운과학적분석방법이사회과학에어떻게수용되었는지를살펴본다.
이책은Part1“자료분석의과학적기초”에대한논의로부터시작한다.Part1은저자가생각하는21세기사회과학자료분석방법이무엇인지에대한논의와확률과확률분포에대한논의를전개하고있다.다른책에비하면확률분포에대한논의가상대적으로많은지면을차지하고있는데,이는사회과학자료분석에서모형수립(modelbuilding)이매우중요하며이를위해서는확률분포를정확하게이해하는것이매우중요하다는저자의믿음때문이다.
Part2는“자료에서분석으로”라고명명했다.여기서는연관성과상관성에대한관심이경험적사회과학의출발점이었으며이를경유해선형회귀모형이라는중요한사회과학모형에경험적사회과학이도달하는과정을설명하고있다.여기서독자들은회귀분석모형과회귀분석모형의추정을분명히구분해야한다.전자는확률이론에토대를둔통계모형이고후자는통계적연산을통해모형의모수를계산하고이를해석하는방법에관한것이다.선형회귀모형은사회과학에서가장많이사용되며앞으로도지속적으로사용될중요한통계모형이다.많은복잡한통계모형도실은선형회귀모형의기본가정과구조에기반한경우가많다.
Part3은2가지통계적추론방법을소개하고있다.먼저선형회귀모형추정을위해등장한최소제곱추정법을살펴보고이를보다일반화해서통계적추론을완성한최대우도추정법을검토한다.세번째중요한추론방법인베이지안추론은Part4에서소개한다.
Part4는베이지안사회과학방법론을소개하고마르코프체인몬테카를로방법을이용한추정법을설명하고있다.베이지안분석의기본구조와주요추정방법에대한소개를다루고있다.
Part5는Part4의논의를토대로정량적역사연구에서베이지안방법을이용한구체적인연구결과를소개하고있다.먼저사회과학의시간성(temporality)에대한논의를토대로베이지안전환점분석방법이가진장점을설명하고이를적용한중요한통계모형을차례로소개하고있다.11장과12장에등장하는모형에대한설명과그래프는모두책저술과정에서새롭게작성된것이다.