R 기반 네트워크 분석 : ERGM과 SIENA

R 기반 네트워크 분석 : ERGM과 SIENA

$34.06
Description
R 기반의 ERGM과 SIENA 모형을 이용하여
네트워크 데이터를 분석하고 모델링하는 과정을 안내한다
‘네트워크’라는 개념은 현대인에게 매우 친숙하다. 일상적으로 접하는 소셜미디어, 수도, 전기, 인터넷, 도로망 등의 사회간접자본 시설은 물론, 국가 간 수출입, 산업생태계 등 경제구조 역시 네트워크 개념을 토대로 설계 및 운용되고 있다. 특히 최근에는 사회적 접촉 네트워크를 통해 전파되는 코로나19 바이러스를 겪으며, 감염병의 전파경로를 파악하고 예방하는 데에도 네트워크 개념이 매우 중요하다는 사실이 알려졌다. 그러나 이처럼 광범위하게 활용되는 네트워크 데이터를 분석하는 일은 생각보다 간단하지 않다. 네트워크 데이터 분석은 통상적인 데이터 분석방법과 달리 ‘관계(relation)’를 다루고 있어 전통적인 독립성 가정(independence assumption)에 부합하지 않기 때문이다. 이러한 점들이 네트워크 데이터를 분석하고 해석하는 과정을 까다롭게 만들고, 그 과정에서 당면하는 다양한 문제들 때문에 많은 연구자들이 네트워크 개념을 다루면서도 네트워크 분석이나 모델링을 외면하기도 한다. 본서는 이처럼 개념적으로 복잡하고 까다로운 네트워크 데이터 분석을 한결 수월하게 이해하고 관련 연구에 활용할 수 있도록 실질적인 도움을 주는 내용으로 구성되어 있다.

본서는 R을 이용하여 네트워크 데이터를 분석하는 방법을 소개하고, 연구가설 테스트를 위해 모형을 추정하고 해석하는 과정을 예시를 통해 설명한다. 네트워크의 특성과 개념, 학문적 배경에서부터 시작하여, 네트워크 데이터에 대한 전통적인 기술통계 분석기법들, 그리고 최근 각광받는 네트워크 모델링 기법인 ‘지수함수족 랜덤그래프 모형(ERGM, exponential random graph model)’과 ‘확률적 행위자중심 모형(SAOM, stochastic actor-oriented model)’ 중 가장 널리 사용되는 ‘시뮬레이션 기반 네트워크 분석(SIENA, simulation investigation for empirical network analysis) 모형’을 다룬다. 책의 말미에는 본서에서 다루지 못한 심화된 네트워크 분석방법을 소개하고 관련 참고문헌을 제시하여 더 깊이 있는 연구 활동에 참고할 수 있도록 하였다.
연구자들은 본서를 통해 R을 이용한 네트워크 분석을 충분히 이해하고, 이를 토대로 탐구하고자 하는 네트워크 현상을 적극적으로 탐구할 수 있는 계기가 될 것이다.
저자

백영민

연세대학교에서신문방송학을전공하고서울대학교언론정보학대학원에서석사학위를받았으며미국펜실베이니아대학교아넨버그커뮤니케이션스쿨에서2011년박사학위를받았다.한국과학기술원(KAIST)조교수를거쳐현재연세대학교언론홍보영상학부부교수로재직중이다.여론조사및수용자조사,계량적연구방법에주로관심을두고연구해왔다.현재R를이용하여실험이나설문자료와같은전통적인사회과학데이터분석은물론,언론보도아카이브,정부문서,온라인공간의댓글등과같은텍스트데이터분석을시도하고있다.사회과학연구자들이R를요령있게사용할수있도록꾸준히소개하면서R기반제한적종속변수대상회귀모형(2019),R기반데이터과학:tidyverse접근(2018),R을이용한다층모형(2018),R를이용한사회과학데이터분석:구조방정식모형분석(2017)등의저서를출간했다.PLOSONE,JournalofCommunication,CommunicationResearch,NewMedia&Society,JournalofBroadcastingandElectronicMedia,AmericanPoliticsResearch,≪한국언론학보≫등여러학술지에논문을게재했고,역서로『포퓰리즘』(2017),『수학적커뮤니케이션이론』(2016),『국민의선택:대통령선거캠페인기간에유권자는지지후보를어떻게결정하는가』(2015)등이있다.

목차


1부네트워크분석의소개와실습준비

1장네트워크분석의이론적배경
1사회과학
1-1사회심리학의소집단연구
1-2사회학과인류학의대인관계및집단구조연구
2사회과학이아닌학문분과
2-1수학
2-2문헌정보학
2-3네트워크과학

2장네트워크분석용어정리
1네트워크와그구성요소
2노드유형및링크유형에따른네트워크구분
3네트워크데이터의구성과분석단위
4네트워크행렬데이터
5네트워크데이터표기

3장네트워크분석을위한R패키지및예시데이터소개
1네트워크분석을위한R패키지
1-1탐색적네트워크분석용패키지(statnet/network,statnet/sna,igraph,tnet)
1-2네트워크시각화용패키지(statnet/network,igraph,ggraph)
1-3네트워크모형추정용패키지(concoR,blockmodeling,statnet/sna,statnet/ergm,ergm.count,ergm.tapered,RSiena)
1-4네트워크분석을위한기타패키지(networkdata,intergraph,rucinet)
1-5기타데이터분석패키지(tidyverse,Hmisc,patchwork,ggrepel,scales,pscl)

2네트워크분석예시데이터

2부네트워크데이터기술통계분석

4장R의네트워크데이터오브젝트및관리
1행렬형태네트워크데이터입력및관리
2링크목록형태네트워크데이터입력및관리
3노드수준데이터와목록형태데이터를네트워크데이터로입력및관리
4이원네트워크데이터입력및관리
5이원네트워크를일원네트워크로변환
6Pajek과UCINET네트워크데이터불러오기

5장노드수준통계치
1일원네트워크노드수준통계치:링크가중치가없는경우
1-1연결중심성지수계산
1-2근접중심성지수계산
1-3사이중심성지수계산
1-4보나시키권력중심성지수계산
1-5페이지랭크중심성지수계산
2이원네트워크노드수준통계치:링크가중치가없는경우
3이원네트워크노드수준통계치:링크가중치가존재하는경우
4기타노드수준중심성지수들

6장링크수준통계치
1링크사이중심성지수계산
2노드속성통계치기반링크수준통계치(양자관계통계치)추출

7장네트워크시각화
1네트워크시각화레이아웃
2R베이스시각화방식
3타이디버스시각화방식
43차원네트워크시각화

8장그래프수준통계치
1네트워크규모
2네트워크연결노드비율및그래프밀도
3그래프중심성지수
4그래프전이성지수(군집계수)
5그래프직경
6그래프동류성지수
7기타그래프수준통계치
8그래프수준통계치를활용한네트워크비교

9장하위네트워크분석
1연구자가지정한노드속성혹은링크속성을기반으로한하위네트워크추출
2응집력강한소집단개념기반하위네트워크:파벌,핵심집단,콤포넌트
3위상분석:유사한위상의노드들로구성된하위네트워크들로분류
4데이터기반노드집단탐색알고리즘활용하위네트워크

3부네트워크데이터추리통계분석

10장일변량및이변량네트워크데이터분석
1단일네트워크통계치대상CUG테스트
2비교가능한두네트워크관계에대한QAP테스트

11장다변량네트워크데이터분석
1선형네트워크회귀모형
2로지스틱네트워크회귀모형
3선형네트워크자기상관회귀모형

4부복합설문데이터심화이슈

12장지수족랜덤그래프모형(ERGM)
1ERGM개요
2ERGM추정시고려사항:추정항및모형퇴행
3이진형-ERGM추정및추정결과해석
3-1무방향일원네트워크대상ERGM추정
3-2유방향일원네트워크대상ERGM추정
4정가-ERGM추정및추정결과해석

13장시뮬레이션기반네트워크분석(SIENA)모형
1확률적행위자중심모형(SAOM)개요
2네트워크진화SIENA모형
2-1데이터준비단계
2-2추정항설정단계
2-3알고리즘설정단계
2-4모형추정·재추정및결과해석
3네트워크-개인행동공진화SIENA모형
3-1데이터준비단계
3-2추정항설정단계
3-3알고리즘설정단계
3-4모형추정·재추정및결과해석

5부마무리

14장네트워크분석시고려사항
1다루지못한영역
1-1네트워크연구설계
1-2네트워크데이터수집기법
2다루지못한기법들
3네트워크분석시고려사항

출판사 서평

주요내용

이책은다음과같이구성되어있다.


1부에서는‘네트워크’의특성과등장배경을소개하고,네트워크데이터분석에필요한기초용어와R패키지들을다룬다.또한,본서에서소개할네트워크데이터와해당데이터분석을위해필요한R패키지들및각패키지의활용법을설명한다.

2부에서는네트워크데이터를대상으로한전통적인기술통계분석기법들을소개한다.먼저통상적인형태의데이터와네트워크데이터의차이를예시를통해설명하고,네트워크를구성하는노드(점,행위자)데이터와링크(선,연결,유대)데이터가전체네트워크데이터를어떻게구성하는지설명한다.이후노드수준과링크수준,그래프수준에서계산할수있는네트워크통계치들을알아보고,R을이용한네트워크분석에서많이활용되는네트워크statnet패키지와igraph패키지로해당네트워크통계치들을계산하는방법을실습한다.아울러네트워크를시각화하는방법과전체네트워크를여러개의하위네트워크로나누는기법들[파벌(cliques),핵심집단(k-core),콤포넌트(component)분석,위상분석(positionanalysis),노드집단탐색알고리즘(community-detectionalgorithm)등]에대해서도소개한다.

3부에서는시뮬레이션이나순열(permutation)을토대로네트워크데이터에적용할수있는전통적추리통계분석기법들로‘조건부단일그래프(CUG,conditionaluniformgraph)테스트’와‘이차순열할당과정(QAP,quadraticassignmentprocedure)테스트’를소개한다.

4부에서는최근인기를얻고있는네트워크모델링기법인‘지수족랜덤그래프모형(ERGM)’과‘확률적행위자중심모형(SAOM)’중가장널리사용되는‘시뮬레이션기반네트워크분석(SIENA)모형’을소개한다.

5부에서는네트워크분석및모델링과관련하여앞에서다루지않은부분들을간략히소개하고,관련참고문헌들을제시한다.아울러네트워크분석과정에서유의할점을정리하여네트워크분석및모델링작업을실시할때살펴볼수있도록한다.