파이썬으로 하는 마케팅 연구와 분석 (데이터 처리부터 시각화까지)
Description
파이썬으로 통계적 기법에 기반해 마케팅 데이터를 분석하는 방법을 설명한다. 그러나 파이썬과 통계를 몰라도 책을 읽는 데 문제는 없다. 1, 2장에 걸쳐 파이썬이 왜 좋은 언어인지 파이썬의 기본 구문은 어떻게 돼 있는지에 대해 친절하게 설명하고 있으며, 이를 통해 파이썬이 처음인 독자들도 책을 읽기 위한 기본 지식을 얻을 수 있게 된다. 이어지는 장에서는 데이터를 다루기 위해 범용적으로 사용되는 파이썬 라이브러리인 Pandas의 데이터프레임을 사용한 데이터 처리 방법을 설명해 준다.
데이터 분석에서 가장 중요한 절차이자, 가장 기초적인 절차는 단연코 시각화이다. 책은 파이썬에 내장된 다양한 시각화 라이브러리를 사용해 데이터를 도식화하는 여러 기법을 설명해 준다. 이를 통해 마케팅이 아니더라도 데이터의 기본 시각화 방법에 대해 잘 알 수 있게 될 것이다. 통계적 검정 방법과 여러 선형 모델을 설명하지만 별도의 통계적 지식이 요구되지는 않는다는 점이 이 책의 큰 장점 중 하나다. 선형 모델 중 다변인 선형회귀도 살펴보며 계층적 모델까지 친절히 설명하고, 데이터 후반부는 차원축소에 연계돼 데이터 분석의 단순화 및 클러스터링을 집중적으로 살펴본다.
저자

제이슨슈바르츠,크리스채프먼,에리맥도넬파이트

(JasonSchwarz)
구글의정량연구원으로,그전에는시스템신경생물학자였다.그의연구분야는지각,주의,동기부여,행동패턴형성과구글에서대규모로연구하는데이터시각화이다.
구글에입사하기전에는신생기업에서데이터과학자로근무하면서파이썬스택으로분석을실행하고프로덕션기계학습모델을개발하고배포했다.

목차

1부.파이썬기초

1장.파이썬시작
1.1파이썬이란?
1.2왜파이썬인가?
1.2.1파이썬대R,줄리아및기타언어
1.3파이썬이아닌이유
1.4파이썬을사용하는경우
1.5이책의사용
1.5.1텍스트정보
1.5.2데이터정보
1.5.3온라인자료
1.5.4잘안될때
1.6요점

2장.파이썬개요
2.1시작하기
2.1.1노트북
2.1.2로컬에파이썬설치
2.1.3로컬에서파이썬실행
2.2파이썬데이터분석기능둘러보기
2.3파이썬명령작업의기초
2.3.1파이썬스타일
2.4기본유형
2.4.1객체및유형
2.4.2부울
2.4.3숫자유형
2.4.4시퀀스유형
2.4.5텍스트유형:문자열
2.4.6집합유형
2.4.7매핑형식
2.4.8함수,클래스,메서드
2.4.9모듈과패키지
2.4.10제어흐름문
2.4.11도움말!쉬어가기
2.5데이터과학패키지
2.5.1NumPy
2.5.2수학적계산에파이썬사용
2.5.3pandas
2.5.4결측값
2.6데이터로드및저장
2.6.1파이썬객체저장:피클
2.6.2데이터가져오기및내보내기
2.6.3코랩사용:데이터가져오기및내보내기
2.7정리!
2.8더알아보기*
2.9요점

2부.데이터분석의기초

3장.데이터설명
3.1데이터시뮬레이션
3.1.1데이터저장:구조설정
3.1.2데이터저장:데이터포인트시뮬레이션
3.2변수를요약하는함수
3.2.1언어요약:groupby()
3.2.2이산변수
3.2.3연속변수
3.3데이터프레임요약
3.3.1describe()
3.3.2데이터검사에대한권장접근법
3.3.3apply()
3.4단일변수시각화
3.4.1히스토그램
3.4.2상자그림
3.4.3정규성확인을위한QQ도면
3.4.4누적분포
3.4.5지도
3.5더알아보기*
3.6요점

4장.연속변수간의관계
4.1소매데이터
4.1.1데이터시뮬레이션
4.1.2온라인및내점판매데이터시뮬레이션
4.1.3만족도조사응답시뮬레이션
4.1.4무응답데이터시뮬레이션
4.2산점도가있는변수간의연관성탐색
4.2.1plot()을사용해기본산점도만들기
4.2.2산점도의포인트색상
4.2.3로그스케일로도식화
4.3단일그래픽객체에서도면결합
4.4산점도행렬
4.4.1scatter_matrix()
4.4.2PairGrid()
4.5상관계수
4.5.1상관관계검정
4.5.2상관행렬
4.5.3상관관계를계산하기전에변수변환
4.5.4일반적인마케팅데이터변환
4.5.5박스-콕스변환
4.6설문응답에서연관성탐색*
4.6.1지터:서수도면을더유익하게만들기
4.7더알아보기
4.8요점

5장.그룹비교:테이블및시각화
5.1소비자세그먼트데이터시뮬레이션
5.1.1세그먼트데이터정의
5.1.2최종세그먼트데이터생성
5.2그룹별설명찾기
5.2.1양방향그룹에대한설명
5.2.2그룹별시각화:빈도와비율
5.2.3그룹별시각화:연속데이터
5.2.4통합하기
5.3더알아보기*
5.4요점

6장.그룹비교:통계검정
6.1그룹비교를위한데이터
6.2그룹빈도검정:scipystats.chisquare()
6.3관찰된비율검정:binom_test()
6.3.1신뢰구간정보
6.3.2binom_test()와이항분포에대한추가정보
6.4그룹평균검정:t-검정
6.5다중그룹평균검정:분산분석(ANOVA)
6.5.1수식구문에대한간략한소개
6.5.2분산분석
6.5.3ANOVA에서모델비교
6.5.4그룹신뢰구간시각화
6.6더알아보기*
6.7요점

7장.결과의동인식별:선형모델
7.1놀이공원데이터
7.1.1놀이공원데이터시뮬레이션
7.2ols()로선형모델적합화하기
7.2.1예비데이터검사
7.2.2요약:이변량연관성
7.2.3단일예측자가있는선형모델
7.2.4ols객체
7.2.5모델적합확인
7.3다중예측자가있는선형모델적합화
7.3.1모델비교
7.3.2모델을사용해예측하기
7.3.3예측자표준화
7.4요인을예측자로사용
7.5상호작용항
7.5.1언어요약:고급수식구문
7.5.2주의!과적합
7.5.3선형모델적합화를위한권장절차
7.6더알아보기*
7.7요점

8장.추가선형모델링주제
8.1고도로상관된변수처리
8.1.1온라인지출의초기선형모델
8.1.2공선성수정
8.2이진결과에대한선형모델:로지스틱회귀
8.2.1로지스틱회귀모델의기초
8.2.2시즌패스의로지스틱회귀데이터
8.2.3판매표데이터
8.2.4로지스틱회귀모델적합화
8.2.5모델재고
8.2.6추가논의
8.3계층적모델소개
8.3.1일부HLM개념
8.3.2놀이공원에대한등급기반공동분석
8.3.3평점기반결합데이터시뮬레이션
8.3.4초기선형모델
8.3.5mixedlm을사용한계층적선형모델
8.3.6완전한계층적선형모델
8.3.7HLM해석
8.3.8HLM에대한결론
8.4더알아보기
8.5요점

3부.고급데이터분석

9장.데이터복잡도줄이기
9.1소비자브랜드평가데이터
9.1.1데이터크기조정
9.1.2속성간의상관관계
9.1.3브랜드별종합평균등급
9.2주성분분석과지각도
9.2.1PCA예
9.2.2PCA시각화
9.2.3브랜드평가를위한PCA
9.2.4브랜드의지각도
9.2.5지각도에대한주의
9.3탐색적요인분석
9.3.1기본EFA개념
9.3.2EFA솔루션찾기
9.3.3EFA로테이션
9.3.4브랜드에요인점수사용
9.4다차원척도법
9.4.1비계량MDS
9.4.2저차원임베딩을사용한시각화
9.5더알아보기
9.6요점

10장.세그멘테이션:부분모집단탐색을위한비지도클러스터링방법
10.1세그멘테이션철학
10.1.1세그멘테이션의어려움
10.1.2클러스터링으로서의세그멘테이션과분류
10.2세그멘테이션데이터
10.3클러스터링
10.3.1클러스터링단계
10.3.2계층적클러스터링
10.3.3계층적클러스터링계속:fcluster의그룹
10.3.4평균기반클러스터링:k_means()
10.3.5모델기반클러스터링:GaussianMixture()
10.3.6클러스터링요약
10.4더알아보기
10.5요점

11장.분류:알려진범주에관측치할당
11.1분류
11.1.1나이브베이즈분류:GaussianNB()
11.1.2랜덤포레스트분류:RandomForestClassifier()
11.1.3랜덤포레스트변수중요도
11.2예측:잠재고객식별
11.3더알아보기
11.4요점

12장.결론

출판사 서평

◈이책의대상독자◈

파이썬을배우고싶어하는마케팅연구원분석가나파이썬을사용해선택한마케팅주제를검토하려는다른분야의학생이나연구원이읽기에적합한책이다.

◈이책의구성◈

순차적으로7개장에걸쳐개념을점진적으로가르치고,작업하면서예제를직접실습해본다.1부에서파이썬언어의기초에대해약간의시간을보낸다음,2부에서는실제마케팅분석문제에적용한다.3부에서는몇가지고급마케팅주제를살펴본다.전체장에서파이썬의위력을보여주고있다.

◈옮긴이의말◈

파이썬을사용해마케팅분석을수행하는각종방법론을설명한책이다.통계적인유의성에기반해다양한마케팅사례를설명하는데,마케팅사례분석을위해파이썬의문법과함께통계적분석또한동시에배울수있으므로일석삼조의효과를볼수있다.특히다양한그래픽기법을통해데이터분석에있어가장중요한시각화기법을익힐수있다.
다양한통계수학이동원되지만,복잡한수식을전개하는것은최대한자제했으며대부분의개념을어려운수학을이해하지않고도습득할수있도록배려한부분또한돋보인다.마케팅에종사하고있는사람이거나,혹은마케팅분야가아니더라도기초데이터의통계적분석기법을파이썬을통해배우고자한다면이책은좋은선택이될것이다.
파이썬을전혀모르는사람들을위해한장에걸쳐파이썬의주요기본문법과데이터유형을일목요연하게정리했다.따라서데이터분석에관심이있는사람은물론처음으로파이썬을배우고자하는사람들에게도좋은지침서가될수있을것이다.