Description
데이터 준비부터 분석을 통한 인사이트 도출까지
데이터를 인사이트로 바꾸는 SQL 활용법
데이터 분석 역량은 분야를 막론하고 경쟁력을 갖추는 데 필수가 되어가고 있다. 이 책은 SQL 데이터 분석이 익숙하지 않은 초급자와 더 나은 쿼리 및 분석 방법을 찾는 SQL 숙련자 모두를 위한 가이드다. 분석에 앞서 데이터를 준비하는 과정부터 실무에서 가장 활용도 높은 시계열, 코호트, 리텐션 분석 등 다양한 분석법을 알려준다. 실제 데이터셋을 사용해 흥미로운 예제를 실습해보며 실전에 가까운 분석 경험을 쌓아보자.

대상 독자
● SQL 문법을 학습했지만 어떻게 데이터 분석에 적용할지 막막한 사람
● 비즈니스 데이터를 분석해 업무 관련 인사이트를 도출하려는 사람

저자

캐시타니무라

저자:캐시타니무라
20여년간금융분야부터B2B소프트웨어,소비자서비스에이르는다양한산업분야에서데이터를분석했다.대부분의상용및오픈소스데이터베이스에서SQL로데이터를분석한경험이있으며여러주요기술회사에서데이터팀과데이터인프라를구축하고관리했다.또한여러콘퍼런스에서데이터문화구축,데이터기반제품개발,포괄적인데이터분석등을주제로강연하고있다.

역자:박상근
KAIST지식서비스공학대학원에서박사학위를받았으며,ACMCHI/CSCW등인간-컴퓨터상호작용(HCI)분야최우수국제학회에데이터기반서비스디자인논문을다수출판했다.현재삼성SDSCX(CustomereXperience)팀에서데이터분석업무를담당하고있다.여러기업의CX컨설팅프로젝트에참여하면서다양한사용자데이터를분석했으며,기획자및디자이너와협업해사용자에게보다나은서비스를제공하기위한새로운인사이트와전략을도출한경험이있다.

목차

CHAPTER1SQL을활용한분석
1.1데이터분석이란
1.2SQL을사용하는이유
1.3데이터베이스타입과활용법
1.4결론

CHAPTER2데이터준비
2.1데이터타입
2.2SQL쿼리구조
2.3프로파일링:데이터분포
2.4프로파일링:데이터품질
2.5준비:데이터정제
2.6준비:데이터셰이핑
2.7결론

CHAPTER3시계열분석
3.1날짜및시간데이터조작
3.2데이터셋:소매업매출
3.3데이터트렌드분석
3.4시간윈도우롤링
3.5계절성분석
3.6결론

CHAPTER4코호트분석
4.1코호트
4.2데이터셋:미국의회입법가
4.3리텐션
4.4관련코호트분석
4.5코호트를활용한크로스섹션분석
4.6결론

CHAPTER5텍스트분석
5.1SQL을활용한텍스트분석
5.2데이터셋:UFO목격보고
5.3텍스트특징
5.4텍스트파싱
5.5텍스트변환
5.6대규모텍스트에서문자열찾기
5.7텍스트구성과형태변환
5.8결론

CHAPTER6이상탐지
6.1SQL을활용한이상탐지
6.2데이터셋:지진발생기록
6.3아웃라이어탐지
6.4이상값의형태
6.5이상값처리
6.6결론

CHAPTER7실험분석
7.1SQL을활용한실험분석
7.2데이터셋:모바일게임사용자
7.3실험유형
7.4실험의어려움과문제해결방법
7.5대체분석방법
7.6결론

CHAPTER8복잡한데이터셋생성
8.1SQL로복잡한데이터셋생성하기
8.2코드구성
8.3쿼리실행순서구성
8.4데이터셋크기및프라이버시관리
8.5결론

CHAPTER9결론
9.1퍼널분석
9.2이탈,휴면의정의
9.3장바구니분석
9.4참고자료
9.5마치며

출판사 서평

대상독자
-SQL문법을학습했지만어떻게데이터분석에적용할지막막한사람
-비즈니스데이터를분석해업무관련인사이트를도출하려는사람

데이터로소통하는시대에필살기가되어줄SQL활용법

데이터로말하고데이터로소통하는시대에,데이터분석은점점선택이아닌필수가되어가고있습니다.데이터를다루는사람이라면기본으로알아야할SQL은이제개발자나데이터베이스관리자뿐아니라다양한비즈니스의기획,마케팅등여러직무로영역을넓혀가고있습니다.SQL을다룰줄안다면방대한비즈니스데이터에서필요한정보를직접추출할수있고,한단계더나아가SQL이지원하는다양한분석법을활용할줄안다면추출한데이터에서의미있는정보를가려내비즈니스에도움이되는인사이트를도출할수있습니다.SQL은데이터분석가가필수로갖춰야할역량이자,비개발직군이라면업무에깊이와통찰을더하고시각을넓혀줄필살기가되어줄겁니다.

“신규고객이얼마나유입됐는가?”,“판매추이가어떠한가?”,“왜어떤고객은한번서비스를이용한후다시돌아오지않는반면,어떤고객은지속해서서비스를이용하는가?”등분석은항상질문을던지는데서시작합니다.답할질문이주어지고나면데이터가어디에서생성되고어디에저장되는지(데이터탐색),주어진데이터를어떻게분석하고,그결과에서어떻게인사이트를찾아낼지(데이터분석)생각합니다.

이책은데이터를분석하는‘쿼리와분석’단계에초점을맞춥니다.다양한사례마다적절한쿼리작성법을알려주면서도분석워크플로내에서데이터를프로파일링및정제하는준비단계도놓치지않습니다.웹사이트에서공개한실제데이터셋으로쿼리를실행해보며시계열분석,코호트분석,텍스트분석등을실무에가깝게실습해봅니다.예제마다제시하는다양한문제에대한답을찾아가며유용한분석법을학습하다보면,여러분에게놓인업무상황에어떤분석법을적용할수있을지그리고그결과를어떻게활용할지길이보일겁니다.

주요내용
-소매업매출데이터셋으로데이터트렌드와계절성분석하기
-국회의원데이터셋으로시간에따른집단별변화분석하기
-UFO목격보고서데이터셋으로텍스트분석하기
-지진발생기록데이터셋으로이상값탐지및처리하기
-모바일게임사용자데이터셋으로실험분석수행하기
-SQL로복잡한데이터셋생성및관리하기