데이터 분석 오답 노트
저자

주정민,허현


저자:주정민
데이터분석가이자교육자.데이터분석교육및AI전략컨설팅회사JUDATA를운영하고있습니다.플랫폼,이커머스,리테일등다양한산업에서데이터분석프로젝트와기업컨설팅을수행했으며코치코리아(CoachKorea),쿠팡이츠등에서데이터분석가로근무하며데이터기반의사결정을지원하는실무프로젝트를진행했습니다.현재는기업과대학,개인을대상으로데이터리터러시,분석및시각화강연을진행하며수천명의수강생에게실무노하우를전하고있습니다.또한글로벌데이터커뮤니티WomeninData™의DataVizClub리더로서데이터시각화역량을공유하는커뮤니티활동을운영하고있습니다.실무현장에서반복적으로나타나는문제와시행착오를바탕으로,더많은사람들이데이터를현실적으로이해하고활용할수있도록돕기위해이책을집필했습니다.

저자:허현
데이터분석가출신의프로덕트매니저.데이터를기반으로제품전략을설계하고,실제서비스성과를만들어내고있습니다.엔씨소프트와콴다를포함한배달,게임,교육등다양한도메인에서데이터분석을경험했습니다.데이터분석으로성과를만드는과정에서겪은다양한시행착오와실무적인고민을정리해,데이터분석을배우는사람들이같은실수를반복하지않도록돕기위해이책을공동집필했습니다.

목차


PART01.데이터분석시작하기
1장데이터는왜중요한가요?
1-1데이터로일하는개인이성장하는이유
1-2데이터로일하는조직이성공하는이유

2장환경설정
2-1빅쿼리환경설정
2-2파이썬환경설정
2-3루커스튜디오환경설정

PART02.데이터분석을위한도구사용법
3장빅쿼리
3-1중복값제거
3-2UTC변환
3-3NULL값처리
3-4CASEWHEN문활용
3-5LIKE를활용한조건문
3-6조인(JOIN)개념이해및올바른사용
3-7UNION과UNIONALL의차이와활용
3-8서브쿼리작성및활용
3-9WITH문을이용한임시테이블생성
3-10윈도우함수활용
3-11피벗테이블생성
3-12정규표현식사용
3-13비율계산시주의사항
3-14무분별한SELECT*사용
3-15파티셔닝과클러스터링최적화
3-16UDF(User-DefinedFunctions)활용
3-17ARRAY와STRUCT데이터타입사용

4장파이썬
4-1파이썬데이터타입변환(astype()활용)
4-2데이터복사시주의사항(copy()메서드활용)
4-3결측값(NaN)처리(dropna(),fillna()활용)
4-4loc,iloc을이용한데이터접근
4-5인덱스재설정(reset_index활용)
4-6그룹화연산(groupby활용)
4-7데이터병합(merge,join메서드활용)
4-8조건부필터링(np.where,query활용)
4-9다중집계함수적용(agg활용)
4-10다양한파일형식다루기(csv,parquet,pickle)
4-11Listcomprehension활용
4-12고성능연산(map,apply활용)
4-13누적계산(cumsum,expanding활용)

5장구글스프레드시트
5-1셀참조방식(상대참조vs절대참조)
5-2데이터커넥터를이용한빅쿼리연동
5-3피벗테이블생성및활용
5-4여러시트의데이터병합
5-5GoogleAppsScript작성및활용
5-6분석차트삽입

6장루커스튜디오
6-1데이터특성에맞는차트선택
6-2차원과측정값의구분및올바른사용
6-3파이차트vs막대차트
6-4산점도vs버블차트
6-5지도시각화기법
6-6이중축그래프활용법
6-73D그래프vs2D그래프
6-8그래프색상활용전략
6-9직관적인대시보드제목및그래프제목작성
6-10효과적인필터활용법
6-11효과적인대시보드레이아웃설계

PART03.데이터분석사고법
7장비즈니스이해하기
7-1비즈니스모델이해
7-2주요비즈니스모델(BM)별핵심지표
7-3지표구조
7-4재무적관점갖추기

8장문제정의하기
8-1중요한문제파악하기
8-2분석의기준세우기
8-3데이터는목적이아닌수단이다

9장가설세우고검증하기
9-1가설과검증구조로생각하기
9-2A/B테스트
9-3가설도창의적이어야한다

10장분석결과전달하기
10-1데이터분석보고서작성법

PART04.데이터분석실무에서마주치는주제들
11장데이터수집과추적
11-1UTM설계
11-2로그설계

12장데이터해석
12-1계절성분석
12-2인과분석
12-3기여분석
12-4공간분석(GIS분석)
12-5고객세그먼테이션
12-6마케팅믹스모델링(MarketingMixModeling,MMM)

13장시각화와커뮤니케이션
13-1대시보드제작

PART05.비즈니스지표용어집
14장AARRR지표정리
14-1AARRR프레임워크소개
14-2Acquisition
14-3Activation
14-4Retention
14-5Revenue
14-6Referral

15장산업별비즈니스지표
15-1사업성과지표
15-2광고산업지표
15-3배달산업지표
15-4이커머스산업지표
15-5패션리테일산업지표
15-6초기사업(스타트업)지표

찾아보기

출판사 서평

이책은데이터분석가나데이터를다루는사람이데이터를왜다루고어떤목적으로다뤄야하는지생각부터바꿔줍니다.데이터를모았다고끝이아니라모은데이터를어떻게효과적으로정리하고시각화하여최종결정권자에게어떤수치를보여줘야하는지실무적인관점에서알려주기때문에데이터를다루는사람이라면꼭읽어야할도서입니다.
많이실수하는부분들을한번체크할수있으며다양한사례와함께자세하게소개합니다.그리고실무에서많이사용하는핵심지표용어를정리했기때문에데이터분석에경험이나지식이없는마케터도이책을통해쉽게익힐수있습니다.또한저자의카톡오픈채팅방을통해언제든지궁금한내용이있으면카카오톡을통해질문할수있어학습에도큰도움이됩니다.

저자의말

누구나데이터를만지고활용해야하는시대가되었지만,역설적으로데이터를어떻게설계하고분석하며활용해야하는지에대한막막함은오히려더커지고있습니다.특히어떤문제를정의해야하는지,어떤데이터를통해해답을찾을수있는지,그리고분석결과를어떻게의사결정으로연결해야하는지에대해많은사람들이어려움을겪고있습니다.
이책이데이터분석가를꿈꾸는학생들에게는단단한기본기를다지는출발점이되고,현장에서의사결정을고민하는실무자들에게는데이터를이해하고활용하는데도움이되는길잡이가되기를바랍니다.또한,데이터분석을배우는과정에서같은실수를반복하지않도록돕는작은안내서가되기를소망합니다.