ggplot2 데이터시각화 그리고 R 코딩

ggplot2 데이터시각화 그리고 R 코딩

$24.04
Description
많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터를 시각화하는 것은 실용적인 중요성 뿐 아니라 학문적 중요성도 동시에 가지게 된다.
빅데이터의 통계처리에 특화된 R 언어 패키지로서 ggplot2 경우는, 빅데이터의 학문적 활용에 두드러지게 많이 활용된다. 이 책은 이러한 ggplot2 데이터시각화를 다룬다.
다른 책에서는 찾기 어려운 이 책만의 뚜렷한 장점은 두 가지이다. 첫 번째는 ggplot2 작동원리를 예시를 들어가면서 분명하게 설명한다는 점이다. 이유는 알 수 없지만, ggplot2 패키지를 만든 이가 쓴 책을 포함한 거의 대부분 전문서적에서도 ggplot2 문법 작동원리가 명확하게 제시되어 있지 않다. 유화를 그리듯 덧칠한다는 원리는 상대적으로 잘 설명되어 있다. 하지만 한번 설정한 것이 이후 작업에도 계속 이어지는가 이어지지 않는가를 다루는 상속inheritance 원리는 그렇지 않다. 두 번째는 도구인 패키지 ggplot을 학습을 통한 R 코딩 원리 이해이다. 보통은 기본 언어 코딩을 배우고 그 다음에 패키지로 넘어가는 수순이다. 이 책의 접근방식은 정반대이다. 비유를 들자면, 이 책의 학습방법은 계산기를 사용한 수학원리의 이해와 비슷하다. 구체적으로 얘기하자면, 요인factor 개념을 들 수 있다. 막대도표를 그림으로써 왜 이러한 요인이라는 형태가 언어에 있어야 하는지를 이해할 수 있다. 통계학자가 만든 R 언어는 통계처리에 특화되어 있다. 이러한 특화는 문자와 숫자가 결합된 형태를 불가피하게 만든다. 시각적으로 제시되어야만, 이러한 구조가 눈에 들어올 수 있다. 당연히 눈에 들어오면 이해가 쉬워진다. 사실은 책 제목에서 알 수 있는 또 하나의 장점이 있다. 데이터시각화 원칙 ggplot2 사용법 그리고 R코딩을 한 권의 책에 쉽고 깊이있게 연결시킨 점이다.
저자

김준우

고려대학교문과대학사회학과졸업
MichiganStateUniversity사회학-도시학박사
SingaporeNationalUniversity박사후과정
부산발전연구원부연구위원
현재전남대학교사회학과교수

저역서
『사회과학의현대통계학』(김영채공저)박영사
『즐거운SPSS,풀리는통계학』박영사
『국가와도시』전남대학교출판문화원(2008년문화체육관광부선정우수학술도서)
『선집으로읽는한국의도시와지역』(안영진공편)박영사
『공간이론과한국도시의현실』전남대학교출판문화원
『황금도시:장소의정치경제학』전남대학교출판문화원
JohnR.Logan&HarveyL.Molotch(2007),UrbanFortunes:
ThePoliticalEconomyofPlace,TheUniversityofCalifornia.
『새로운지역격차와새로운처방:철근/콘크리트에서지역발전유발지식
서비스로』(안영진공저)박영사
『서울권의등장과나머지의쇠퇴』전남대학교출판문화원
『미국이라는공간:부동산투기ㆍ노예제ㆍ인종차별ㆍ인디언제거ㆍ뺏기는삶의터전』박영사
『어원+어원=영단어』박영사
『어원과동사』전남대학교출판문화원
『20세기공간이론』전남대학교출판문화원
『즐거운R코딩,풀리는RCommander확률통계』박영사
『이념과공간』(안영진공저)전남대학교출판문화원

목차

1기본언어R그리고작업도구ggplot2/13

2ggplot2기본단위데이터프레임/25

3그림그려나가는일련의과정으로서의ggplot2/33

4시간흐름의선도표/51

5변수를매핑mapping그리고어떤값을세팅setting/61

6면분할faceting/75

7산점도그리기와데이터프레임에서$기호/85

8유화그리듯덧칠해나가는ggplot2문법/97

9전체적구도와배경바꾸는theme함수/111

10겹침해결하는jitteralpha/135

11여성기대수명과일인당국내총생산실제자료의실제처리/143

12중위수사분위수상자도표그리고선택으로서데이터시각화/151

13막대도표와히스토그램은다르다/169

14남녀분포와같이아주간단한것만원도표만들어야/183

15팔꿈치로살짝밀기nudge/201

16축범위조절과시간날짜/207

17행마다의이름rownames/217

18요인factor/223

19누적막대도표/231

20ggplot2쓸때실제로필요해지는요인factor/243

21결측값NA/257

22색깔은꼭필요한곳에만/267

■본문에인용되어있고또읽어볼만한책/276
■찾아보기/277