R 데이터 시각화 쉽게 배우기: ggplot2, lessR을 중심으로

R 데이터 시각화 쉽게 배우기: ggplot2, lessR을 중심으로

$20.93
Description
- 선도적인 시각화 체계, ggplot2의 철저한 적용 범위 제시
- ggplot2가 제공하는 것과 동일한 품질의 시각화를 구현하기 위해 기본 R 그래픽 사용
- 광범위한 데이터 시각화를 생성하는 방법: 범주형, 연속형, 시계열, 공간 데이터 분포에 대한 다양한 유형의 산점도, 시계열 그리고 지도 등
- 시스템이 아닌 주제별로 구성된 R 그래픽에 대한 다양한 접근 방식 포함
- R을 이용한 대화형 시각화에 관한 최근 연구 제시

통계적으로 데이터를 분석할 뿐 아니라 데이터 시각화를 통해 데이터로부터 의미를 도출하는 R 프로그래밍 언어의 기능을 독자들에게 소개할 목적으로 이 책의 만들었다. 다른 그래픽 시스템, 예를 들어, 데이터 시각화용 패키지로서 지금까지 최고의 인기를 누리고 있는 ggplot2 패키지보다 훌륭한 능력을 발휘하는, 2022년 개발된 lessR 그래픽 시스템을 소개하고자 하였다. ggplot2 등과 같은 다른 그래픽 시스템보다 매우 적고 단순한 코딩으로, 보다 매력적인 데이터 시각화를 구현할 뿐 아니라, 동시에 데이터를 통계적으로 분석한다는 것이 lessR 그래픽 시스템의 장점이다. 이 책 전반에 걸쳐 ggplot2 그리고 lessR 패키지 모두에서 구현된 데이터 시각화 결과를 비교하면서, 데이터 시각화의 다양한 확장성을 보여줄 것이다.
저자

DavidW.Gerbing

DavidW.Gerbing은1979년미시건주립대학에서정량분석학박사학위를받았으며,현재는미국포트랜드주립대학의경영학부정량분석학과교수로재직하고있다.정량적방법에중점을둔사회과학및행동과학분야에서광범위하게도서들을출간했다.그의연구관심사에는정량분석,다변량통계량,그리고행동측정및평가등이있다.현재그의주된관심사는,프로그래머가아닌사람들이너무비싼학습비용없이무료오픈소스데이터분석시스템에접근할수있도록,데이터과학을위한R프로그래밍언어의접근성을높이는것이다.그의lessR패키지는2009년부터개발중이다.

목차

자자서문
역자서문

1장데이터시각화

1.1소개
1.1.1데이터시각화와분석
1.1.2데이터시각화용오픈소스소프트웨어
1.2데이터
1.2.1R객체
1.2.2예제데이터:Employee
1.2.3변수유형
1.2.4데이터읽어오기
1.2.5변수레이블
1.2.6팩터유형의범주형변수
1.2.7데이터프레임저장하기

2장빠르게데이터시각화하기

2.1시각화시스템
2.1.1ggplot2및lessR패키지의상대적이점
2.1.2그레이스케일시각화
2.2범주형변수분포
2.2.1단일변수막대그래프
2.2.2다중변수막대그래프
2.3연속형변수분포
2.3.1기본히스토그램
2.3.2히스토그램외
2.4두변수사이의관계
2.4.1기본산점도
2.4.2향상된산점도
2.5시간경과에따른데이터분포
2.5.1시계열
2.5.2다중시계열

3장범주형변수시각화

3.1막대그래프,점도표,버블차트
3.1.1수평막대그래프
3.1.2Cleveland점도표
3.1.3버블차트
3.1.4비율표시
3.2단일패널에다중변수시각화
3.3수치값제공
3.3.1개별데이터값의막대그래프
3.3.2긴이름의수직레이블
3.3.3개별데이터값의클리블랜드점도표
3.3.4범주형변수별평균시각화
3.4막대채우기색을활용한정보전달
3.4.1평균편차값에따라두갈래로나뉜막대채우기색
3.4.2순서형변수의막대그래프
3.4.3사용자지정막대채우기색
3.5저장된출력에서보고서작성
3.6부분과전체의관계시각화
3.6.1도넛차트및파이차트
3.6.2와플차트
3.6.3트리맵

4장연속형변수시각화

4.1히스토그램
4.1.1인접구간에연속형변수배치
4.1.2다양한형태의히스토그램
4.1.3누적히스토그램
4.1.4도수다각형
4.2밀도플롯
4.2.1개선된밀도플롯
4.2.2중첩밀도곡선
4.2.3러그플롯
4.2.4바이올린플롯
4.3박스플롯
4.3.1표준박스플롯
4.3.2비대칭박스플롯
4.4단일변수산점도
4.5통합바이올린플롯(V)/박스플롯(B)/산점도(S)
4.5.1VBS플롯
4.5.2리커트데이터의VBS플롯
4.5.3트렐리스플롯또는부분도(Facets)
4.6파레토차트

5장두연속형변수관계시각화

5.1개선된산점도
5.1.1산점도에타원추가
5.1.2산점도에최적선추가
5.1.3주석
5.2세번째변수매핑
5.2.1군집변수데이터를미학으로매핑
5.2.2트렐리스산점도(부분도)
5.2.3시각적미학으로3번째연속형변수매핑
5.2.4동일패널에다중변수시각화
5.3변수집합의상호관계
5.3.1산점도행렬
5.3.2상관행렬의히트맵
5.4대용량데이터세트에대한산점도
5.4.1평활산점도
5.4.2등고선산점도와육각-빈산점도

6장다중범주형변수시각화

6.1두범주형변수
6.1.1누적2-변수막대그래프
6.1.2분할2-변수막대그래프
6.1.3트렐리스플롯또는부분도
6.2다른유형의2-변수막대그래프
6.2.1정렬된2-변수막대그래프
6.2.2수평막대그래프
6.2.3상단에범례가있는막대그래프
6.2.4100%누적막대그래프
6.2.5두범주형변수에대한평균의막대그래프
6.2.62-변수클리브랜드점도표
6.2.7대응표본t-검정시각화
6.3모자이크플롯및연관도
6.3.1모자이크플롯
6.3.2독립성과피어슨잔차
6.3.3연관도

7장시간경과에따른데이터시각화

7.1런차트와관리도
7.1.1런차트
7.1.2관리도
7.2시계열
7.2.1채워진영역시계열
7.2.2누적다중시계열
7.2.3포맷된다중패널시계열
7.2.4날짜변수를위한데이터준비
7.3예측
7.3.1시계열객체
7.3.2계절/추세/순환패턴분해
7.3.3예측생성

8장지도및네트워크시각화

8.1지도시각화
8.1.1세계지도
8.1.2래스터이미지
8.1.3온라인지오코드데이터베이스
8.1.4도시가표시된국가지도
8.1.5등치지역도
8.2네트워크시각화
8.2.1네트워크데이터
8.2.2시각화
8.2.3네트워크분석

9장대화형시각화

9.1샤이니를이용한대화형시각화
9.1.1정적시각화대대화형시각화
9.1.2샤이니개요
9.2샤이니앱실행
9.2.1RStudio내에서샤이니
9.2.2샤이니앱웹에출판

10장사용자지정시각화

10.1색상참조
10.1.1색상묘사
10.1.2매개변수:fill과color
10.2팔레트
10.2.1정성팔레트
10.2.2순차팔레트
10.2.3발산팔레트
10.3테마
10.3.1영구테마
10.3.2현재시각화에적용된테마
10.4사용자지정개별특성
10.4.1개별특성목록
10.4.2사용자지정단일분석
10.4.3영구테마갱신및저장
10.4.4사용자지정여백응용

출판사 서평

최근,유망미래기술에대한대부분의조사결과를바탕으로,4차산업혁명의한축을이루는데이터과학분야로범위를좁히면데이터분석,시각화및모델링등을처리하는R프로그래밍이두각을보이고있는것을알수있다.
정보기술의발전과더불어생활방식의변화로분석이필요한데이터의양이급격하게증가하고,데이터유형도매우다양해지면서기존의도구만으로데이터분석및데이터시각화를실현하는데어려움이있었으나,R과같은해석적프로그램언어가적합한해결책이되어다행스럽게생각한다.특히,데이터분석가와생물정보학자에게매력적인인기를얻고있는R은오픈소스컴퓨팅패키지이기때문에,쉽게구할수있으며사용하기에매우경제적이라는점을주목할만하다.게다가사용자가더욱쉽게직관적으로R프로그래밍언어를코딩할수있는통합개발환경(IntegratedDevelopmentEnvironment)을제공하는RStudio를활용하면,마크다운(Markdown),샤이니(Shiny),콰토(Quarto),그리고스위브(Sweave)등의프로젝트를통해다양한확장기능들을구현할수있는장점이있다.
통계적으로데이터를분석할뿐아니라데이터시각화를통해데이터로부터의미를도출하는R프로그래밍언어의기능을독자들에게소개할목적으로이책의번역을기획하게되었다.다른그래픽시스템,예를들어,데이터시각화용패키지로서지금까지최고의인기를누리고있는ggplot2패키지보다훌륭한능력을발휘하는,2022년개발된lessR그래픽시스템을소개하고자하였다.ggplot2등과같은다른그래픽시스템보다매우적고단순한코딩으로,보다매력적인데이터시각화를구현할뿐아니라,동시에데이터를통계적으로분석한다는것이lessR그래픽시스템의장점이다.이책전반에걸쳐ggplot2그리고lessR패키지모두에서구현된데이터시각화결과를비교하면서,데이터시각화의다양한확장성을보여줄것이다.

이책은R언어를처음접하는초보자또는어떠한프로그래밍경험이나데이터분석지식을갖지못한독자를대상으로하며,독자가데이터시각화또는데이터분석을추구하는데이터과학자가되고자할때훌륭한안내서가될것이다.1장과2장에서는데이터시각화시스템을정의하고,빠르게시각화하는방법을터득할것이다.그리고변수의유형에따라범주형변수의시각화(3장),연속형변수의시각화(4장),두연속형변수관계시각화(5장),다중범주형변수시각화(6장),시간경과에따른시각화(7장),그리고지도및네트워크시각화(8장)를배우며,9장에서샤이니앱을통한대화형시각화를구현하는방법을다루며,10장에서고급스러운데이터시각화를실현하기위하여사용자지정데이터시각화를배우게된다.

본책이데이터분석및데이터시각화를배우려는독자들에게조금이라도도움이되었으면한다.