데이터 시각화 교과서 (데이터 분석의 본질을 살리는 그래프와 차트 제작의 기본 원리와 응용)

데이터 시각화 교과서 (데이터 분석의 본질을 살리는 그래프와 차트 제작의 기본 원리와 응용)

$28.00
Description
정확성과 심미성을 모두 갖춘 데이터 시각화에 대한 바이블!
통계적 본질에 근거해 데이터 분석 결과를 효율적으로 전달하는 데이터 시각화에 대한 모든 것!
데이터 시각화는 예술이자 과학이다. 과학적으로 정확하면서 미적으로 흉하지 않아야 하며, 또한 미적으로 탁월하면서도 과학적으로 오류를 용납하지 않는 결과물을 만들어야 한다. 데이터 시각화는 무엇보다도 데이터를 정확하게 전달해야 한다. 데이터 분석 결과를 정보 왜곡 없이 사실 그대로, 그리고 보는 사람에게 인지적 부담 없이 쉽고 명확하게 전달하는 ‘그래프와 차트, 도표’ 제작 방법에 대한 기본 원리와 실전 응용에 대해 자세히 설명한다. 데이터 과학자, 디자이너, 마케터, 컨설턴트, 학생, 교수, 의사, 기자, 직장인, 기업 대표 등 누구나 할 것 없이 정확하고 올바른 정보 전달에 관심 있는 이라면 누구나 참고해서 읽어야 할 책이다.
저자

클라우스윌케저,권혜정역,최재원

ClausO.Wilke
텍사스대학교오스틴캠퍼스의통합생물학교수다.독일보훔루르대학교에서이론물리학박사학위를받았다.계산생물학,수학적모델링,생물정보학,진화생물학,단백생화학,바이러스학,통계학을주제로한과학논문170편이상을단독또는공동으로저술했다.카우플롯(cowplot),지지릿지(ggridges)등데이터시각화에쓰이는인기R패키지를작성하고,지지플롯2(ggplot2)패키지제작에도기여했다.

목차

1장_시작하며:이책의내용과구성
__이책의예시그래프를이해하는법

[1부]데이터,시각화로날개를달다
2장_데이터시각화:'읽는'데이터에서'보는'데이터로
__시각적속성의의미와데이터유형
__데이터값을시각적속성으로바꾸기
3장_위치스케일:좌표와축
__데카르트좌표
__비선형축
__곡선축이있는좌표계
4장_색상스케일
__색을활용한데이터구분
__색을활용한데이터값표현
__색을활용한강조
5장_다양한시각화방식
__수량의시각화
__분포의시각화
__비율의시각화
__x-y관계로나타내는시각화
__지리공간데이터의시각화
__불확실성의시각화
6장_수량데이터의시각화
__막대도표의다양한활용
__묶은막대와누적막대
__점도표와히트맵
7장_데이터분포의시각화:히스토그램과밀도도표
__단일분포상태의시각화
__여러분포상태를하나의도표로시각화
8장_데이터분포의시각화:경험적누적분포함수와QQ도표
__경험적누적분포함수
__고도의비대칭분포
__QQ도표
9장_여러분포상태의결합시각화
__가로축에기준을둔분포상태의시각화
__세로축에기준을둔분포상태의시각화
10장_비율데이터의시각화
__파이차트
__병렬막대도표
__누적막대와누적밀도도표
__전체대비부분비율의표현
11장_내포된비율데이터의시각화
__내포비율시각화의잘못된사례
__모자이크도표와트리맵
__내포파이차트
__평행집합
12장_여러정량변수의관계시각화
__산점도
__상관곡선
__차원축소
__쌍데이터
13장_독립변수의시계열데이터와함수시각화
__단일시계열데이터
__다중시계열데이터와용량-반응곡선
__2개이상의반응변수를포함한시계열데이터
14장_추세의시각화
__평활화를통한데이터보정
__정의된함수형식으로추세시각화
__추세제거와시계열데이터분해
15장_지리공간데이터의시각화
__투영도법
__레이어를활용한지도
__단계구분도
__단순화한카토그램
16장_불확실성의시각화
__빈도의개념을이용한확률의시각화
__점추정의불확실성시각화
__곡선적합의불확실성시각화
__가설적결과도표

[2부]그래프디자인의기본원칙
17장_잉크양비례의원칙
__선형축도표그리기
__로그축이있는도표그리기
__데이터값을면적으로나타내기
18장_오버플로팅:겹치는점처리방법
__반투명값과지터링
__2차원히스토그램
__등고선그래프
19장_효과적인색사용을위한조언
__목적없는무분별한색사용은금물
__비단조적색상스케일구성
__색각이상자를배려하자
20장_불필요한기호화
__불필요한기호화는범례디자인을망친다
__범례가없어도좋은도표
21장_여러개의패널로구성된도표
__소형다중패널
__복합형도표
22장_제목,캡션,표의효과적활용
__도표제목과캡션
__축과범례제목
__표,제대로만들기
23장_데이터이해를돕는시각화의주변요소
__적절한수준의요소활용
__배경격자
__쌍데이터__
24장_축레이블의글자는큼직하게
25장_선그림은피하자
26장_3차원그래픽과차트는그만
__불필요한3차원그래픽은지양하자
__3차원위치스케일도이제그만
__3차원시각화가필요한경우

[3부]시각화레벨업을위한꿀팁
27장_가장흔히쓰는이미지파일형식
__비트맵과벡터그래픽
__비트맵그래픽무손실및손실압축
__이미지형식변환하기
28장_올바른시각화소프트웨어선택법
__재현가능성과반복가능성
__데이터의탐색적분석과데이터표현
__내용과디자인은분리하자
29장_스토리텔링과요점전달
__이야기란무엇일까
__장군님을위한도표만들기
__방대한정보는복잡한도표로
__기억에남는도표만들기
__일관성을유지하되반복은피할것

출판사 서평

[이책의구성]
이책은3부로구성된다.1부‘데이터,시각화로날개를달다’에서는막대그래프,산점도,파이차트같은도표와차트유형을설명한다.특히시각화의과학적원리에중점을둔다.세상에존재하는모든시각화방식을백과사전처럼나열하기보다는,발표자료에많이나오거나도표를직접만들때유용한핵심적인시각적효과들을소개한다.1부에서는시각화하려는데이터의유형이아니라전하고자하는메시지의유형에따라,시각화를분류해설명한다.

2부‘그래프디자인의원칙’에서는도표들을결합할때생기는여러디자인문제를다룬다.데이터시각화의미적측면에가장중점을두지만,물론그게전부는아니다.주어진데이터셋에알맞은유형의도표나차트를선택했다면색상,기호,글씨크기같은시각적요소를보기좋게구성해야한다.그래야뜻이명료하게전달되고보기에도좋은결과물이나온다.2부의각장에서는그동안내가실무에서거듭겪어왔던여러문제를다룬다.

3부‘시각화레벨업노하우’에서는1부나2부에부합하지않는그밖의주제들을다룬다.이미지와그래프를저장할때주로선택하는파일형식,시각화소프트웨어선택기준,문서전체의맥락을고려한그래프배치방법을설명한다.

이책은논리적인순서로전개되지만각장이독립적인내용으로구성되어있으므로첫장부터차례대로읽지않아도된다.자유롭게페이지를건너뛰면서그때그때관심있는부분이나고민중인주제를다루는부분을찾아읽자.한번에끝까지읽기보다항상곁에두고조금씩읽으면서,시각화도표를만들때마다책에나오는개념을몇가지씩시도해보고,다음번에는다른개념이나오는장을읽거나예전에읽었던장을복습하는편이이책을더알차게활용하는방법이다.예전에읽었던장을몇달뒤다시읽으면같은내용에서도다른깨달음을얻을수도있다.

이책에나오는시각화도표는대부분R의지지플롯2(ggplot2)패키지로만들었다.그러나책자체는R언어에국한되지않고시각화도표제작에통용되는원칙을다룬다.무슨소프트웨어를사용했는지는부수적인요소일뿐이다.이책에나오는도표는어떤시각화소프트웨어를사용해서든만들수있다.다만지지플롯2나비슷한패키지들에는다른시각화라이브러리에비해이책에쓰인기능들이훨씬편리하게구현되어있다.무엇보다도이책은R언어학습서가아니므로코드나프로그래밍기술을설명하지않는다.따라서코딩보다는도표자체의개념에집중하자.시각화도표만드는방법이궁금하다면깃허브(https://github.com/clauswilke/dataviz)에서이책의소스코드를확인할수있다.또한관련한패키지설치환경과방법은이책의도서정보페이지(https://www.onlybook.co.kr/entry/dataviz)에서찾아볼수있다.

[이책의주요특징]
■색상을활용해데이터를강조,구별,표현하기위한기본개념
■핵심정보를다양한방식으로제공하는올바른기호화
■자주쓰이는데이터시각화유형들을그래픽으로확인
■좋은그래프와나쁜그래프에대한다양한예시
■문서나보고서에서이야기를효율적으로전달하는차트활용법

[이책의독자대상]
데이터과학자,데이터분석가,디자이너,마케터,컨설턴트,학생,교수,의사,기자,직장인,기업대표등누구나할것없이,정확하고올바른정보전달에관심있는이라면누구나

[옮긴이의글]
데이터시각화는다양한의미가담긴숫자들을점으로,선으로,면으로그려내는작업입니다.수학적언어를시각적언어로‘번역’하는작업이죠.제가이책을위해한일도영어를한국어로번역하는것이었습니다.이렇게공통의키워드를놓고보니,번역과데이터시각화에는제법비슷한구석이많아보였습니다.사실요즘세상에서는번역기를돌리면1초만에뚝딱하고번역문이나오기도합니다.지금당장마이크로소프트워드에서차트메뉴에들어가숫자를대강입력하면그럴싸한그래프가나오는것처럼말입니다.하지만이책을그런식으로번역했다면지금제가‘옮긴이의글’이라는제목으로지면한장을차지하는사치를누리지는못했을겁니다.진작에짤렸겠죠.

그런불상사없이저자의메시지를여러분께전달하기위해저는영어에대한기본적이해를바탕으로원문의의미를정확히파악하고,전문기술서에맞는어투를선택하고,같은뜻이라도무슨한국어단어를골라어떻게배열해야독자들에게잘이해될까고민하며한문장한문장을옮겼습니다.수학적이해를바탕으로데이터를통찰하고,특성에맞는시각화방식을선택하며,요소들의크기와모양,색상,위치를이리저리조절해서비로소의미있고효과적인그래프를완성하는것과같은과정이었습니다.

번역실무자입장에서,이책은데이터를유창한시각언어로번역하는방법을꽤나체계적으로설명한알짜배기라는생각이듭니다.그래서연구실이나회사에서데이터를다루는분들이가장큰관심을가지시겠지만,실무자가보고하는시각화결과물을보면서의사결정을해야하는‘장군님’들에게도유용한책이아닐까합니다.아는만큼보인다는말이있듯이,데이터시각화의원리와과정을잘알면다른사람이만든그래프도더정확하게이해하고핵심을간파할수있으니까요.왜‘장군님’을거명했는지는책을읽으면서직접발견하시면좋겠습니다.

[감수의글]
데이터시각화과정에서두가지원칙을지켜야한다.하나는사실의왜곡이없어야하는것이고다른하나는보는사람이인지적인부담없이쉽고명확하게시각화결과물을이해할수있어야한다는점이다.그런데실제업무에서이런원칙을지키는것은쉽지않다.데이터의특징이나분석결과물은숫자인데이를시각적요소로변환하는과정에서필연적으로질적인변화가발생하기때문이다.마치애니메이션과실사물의차이처럼내용과주제는같지만표현하는방식이완전히달라지는것이다.

이책의독특함과효용성은숫자를시각적요소로변환하는과정에서핵심적인고려사항을구체적이고도명확하게제시하고있다는점이다.예를들어분석결과는두그룹의평균값의비교일수도있고,비율의비교일수도있으며,시간에따른추세의변화일수도있고심지어는확률의불확실성마저분석결과의하나로서시각화의대상일수있다.이렇게다양한분석결과를왜곡없이효과적으로전달하기위해차트의모든구성요소,즉축,스케일,차트모양,기호,색상,그래프면적등이어떻게서로조화롭게조직되어야하는지잘정리되어있어서감수작업을하면서도데이터시각화에대해체계적으로다시한번정리할수있는유익한계기가되었다.