파이썬으로 풀어보는 회귀분석 (단순선형회귀분석부터 고급 회귀분석까지)

파이썬으로 풀어보는 회귀분석 (단순선형회귀분석부터 고급 회귀분석까지)

$31.19
Description
파이썬을 이용해 데이터 분석과 모델 구축, 그리고 성능 향상에 필요한 다양한 기법을 제공한다. 단순선형회귀분석부터 다중회귀분석, 로지스틱회귀분석, 그리고 라소 리지 회귀분석, 베이지안 회귀분석, 회귀 트리, 베깅 및 부스팅 등의 고급 회귀분석에 이르기까지 다양한 방법을 기술한다. 또한 데이터의 준비 과정과 데이터를 처리하는 방법, 모델에 데이터를 공급하는 방법에 대해서도 다룬다. 이 책은 파이썬 코드로 제공된 예제를 따라가면서 쉽게 이해할 수 있도록 구성됐다.
저자

루카마싸론

데이터과학자이며마케팅연구책임자로,다변량통계분석및머신러닝을전문으로하며,10년이상의경험을바탕으로추론,통계,데이터마이닝및알고리즘을적용해실생활문제를해결하고이해관계자의가치를창출하는고객통찰력을제공해왔다.이탈리아에서웹이용자분석의선구자가된이후,캐글러(Kaggler)의상위10위를달성하는데이르기까지데이터와분석에관한모든것에항상열성적이었으며전문가와비전문가모두에게데이터기반지식검색의잠재력을일깨워줬다.불필요한정교함보다는단순함을선호한다.데이터과학에서본질적인것만수행해도많은것을성취할수있다고믿는다.

목차

지은이소개
기술감수자소개
옮긴이소개
옮긴이의말
들어가며

1장.회귀분석-데이터과학의주역
__회귀분석과데이터과학
____데이터과학의가능성답사
____데이터과학의난제
____선형모델
____이책의목표
__데이터과학을위한파이썬
____파이썬설치
____파이썬2와파이썬3의선택
____단계별설치
____패키지설치
____패키지업그레이드
____과학용배포판
____Jupyter및IPython소개
__선형모델을위한파이썬패키지와함수
____NumPy
____SciPy
____Statsmodels
____Scikit-learn
__요약

2장.단순선형회귀분석접근
__회귀문제정의
____선형모델과지도학습
____선형모델제품군
____단순선형회귀를위한준비
__기초부터시작
____선형관계측정
__선형회귀로확장
____Statsmodels를사용한회귀
____결정계수
____계수의의미와중요성
____적합값평가
____상관관계는인과관계가아니다
____회귀모델을이용한예측
____Scikit-learn을사용한회귀
__비용함수최소화
____제곱오차를사용하는이유
____의사역행렬및기타최적화방법
____작업에서의기울기하강
__요약

3장.다중회귀분석
__여러특성사용
____Statsmodel로모델구축
____공식을대안으로사용
____상관행렬
__기울기하강재방문
____특성조정
____비표준화계수
__특성중요도평가
____표준화된계수검사
____R2으로모델비교
__상호작용모델
____상호작용발견
__다항식회귀
____선형대3차변환테스트
____더높은차수의솔루션제공
____과소적합과과잉적합소개
__요약

4장.로지스틱회귀
__분류문제정의
____문제의공식화:이진분류
____클래시파이어의성능평가
__확률기반접근법정의
____로지스틱함수와로짓함수에대한추가정보
____몇가지코드확인
____로지스틱회귀의장점과단점
__기울기하강재방문
__다중클래스로지스틱회귀
__예제
__요약

5장.데이터준비
__숫자특성조정
____평균중심화
____표준화
____정규화
____로지스틱회귀사례
__정성적특성인코딩
____Pandas를이용한더미코딩
____DictVectorizer와one-hotencoding
____특성해셔
__수치특성변환
____잔차측정
____비닝방법
__누락데이터
____누락데이터대체
____누락된값추적
__이상치
____응답에서의이상치
____예측변수의이상치
____이상치제거또는교체
__요약

6장.일반화달성
__샘플외데이터검사
____샘플분할테스트
____교차검증
____부트스트래핑
__특성의그리디선택
____마델론데이터셋
____특성의일변량선택
____재귀적특성선택
__그리드검색에의한최적화된정규화
____리지(L2정규화)
__최적의파라미터를위한그리드검색
____무작위그리드검색
__라쏘(L1정규화)
____엘라스틱넷
__안정성선택
____마델론실험
__요약

7장.온라인과일괄학습
__배치학습
__온라인미니배치학습
____실제예제
____테스트셋없는스트리밍시나리오
__요약

8장.고급회귀방법
__최소각도회귀
____LARS의시각적쇼케이스
____코드예제
____LARS정리
__베이지안회귀
____베이지안회귀정리
__힌지손실이있는SGD분류
____로지스틱회귀와비교
____SVR
____SVM정리
__회귀트리(CART)
____회귀트리정리
__배깅과부스팅
__배깅
____부스팅
____앙상블정리
__LAD를이용한기울기부스팅리그레서
____LAD를사용한GBM정리
__요약

9장.회귀모델의실제응용
__데이터셋다운로드
____시계열문제데이터셋
____리그레션문제데이터셋
____다중클래스분류문제데이터셋
____랭킹문제데이터셋
__회귀문제
____리그레서대신클래시파이어로테스트
__불균형및다중클래스분류문제
__순위문제
__시계열문제
____공개질문
__요약

찾아보기

출판사 서평

★이책에서다루는내용★

■선형회귀분석이데이터과학의주역인이유확인
■데이터셋으로부터회귀모델을생성하고성능평가
■예측을필요로하는실제문제에다중선형회귀분석적용
■로지스틱회귀분석을사용해훈련및테스트포인트분류방법학습
■다양한데이터정리와데이터준비기술을사용해데이터행렬생성
■과잉적합문제를해결하기위한몇가지기술적용
■특성생성및다항식확장을통한과소적합문제해결
■선형모델을대형데이터셋으로확장하고데이터를처리하는방법학습

★이책의대상독자★

데이터과학과통계,수학에대한기본적인이해를가진파이썬개발자를대상으로한다.또한데이터과학이나통계학의배경지식을꼭필요로하지는않지만,데이터셋에대한회귀분석을가장효과적으로수행하는방법을배우려는모든연공서열의데이터과학자에게적합한책이다.여기서는단순하고이해하기쉬우면서효과적인기법을선보인다.이책은파이썬을사용해서더빠르고더나은선형모델을만들고결과모델을파이썬이나원하는컴퓨터언어로배포할수있는지식을제공할것이다.

★이책의구성★

1장,‘회귀분석?데이터과학의주역’에서는회귀분석이데이터과학에실제로유용한이유,데이터과학을위해파이썬을신속하게설정하는방법과예제를통해책전체에사용된패키지의개요를소개한다.
2장,‘단순선형회귀분석접근’에서는먼저회귀문제를설명하고리그레서를적합시킨다음알고리즘의수학공식에깔려있는의미를부여함으로써단순한선형회귀분석을제시한다.그런다음더높은성능을위해모델을튜닝하는방법과모든파라미터를깊이있게이해하는방법을배울것이다.마지막으로기울기하강에대해설명한다.
3장,‘다중회귀분석실행’에서는단순선형회귀분석을확장해여러특성에서예측정보를추출하고실제예측작업을해결할수있는모델을만든다.또한특성행렬에대처하고개요를완성하기위해강화된확률적기울기하강기술과다중공선성,상호작용및다항식회귀에관해다룬다.
4장,‘로지스틱회귀분석’에서는선형모델에대한지식의기초를계속해서제공한다.필요한수학적정의부터시작해선형회귀를이진및다중클래스분류문제로확장하는방법을보여준다.
5장,‘데이터준비’에서는최상의방법으로데이터를준비하기위해수행할수있는작업과특히데이터가누락돼이상치가존재하는것과같은비정상적인상황에서데이터를처리하는방법등모델에데이터를공급하는법을설명한다.
6장,‘일반화달성’에서는좀더복잡한기술로들어가기전에모델을철저하게테스트하고최상의상태로튜닝해간결하게만들고실질적인최신데이터를얻는데필요한핵심데이터과학방법을소개한다.
7장,‘온라인과일괄학습’에서는빅데이터에서클래시파이어를훈련하는모범사례를설명한다.먼저일괄학습과그한계에대해초점을맞추고그다음온라인학습을소개한다.마지막으로온라인학습의이점과해싱트릭의효과를결합한빅데이터의사례를보여준다.
8장,‘고급회귀분석방법’에서는몇가지고급회귀분석방법을소개한다.수학적공식에너무깊이들어가지않고실용적인적용을주시하면서최소각도회귀,베이지안회귀및힌지손실을포함한확률적기울기하강에대한아이디어를다루고배깅및부스팅기술을접한다.
9장,‘회귀모델의실제응용’에서는선형모델로해결되는실제데이터과학문제의네가지실용적인사례로구성된다.궁극적인목표는주어진문제에접근하는방법과해결방법에대해추론을어떻게발전시켜나가는지보여줌으로써발생할수있는유사한문제에대한청사진으로활용할수있게하는것이다.

★옮긴이의말★

데이터가가속화되고있는상황속에서이책은데이터를정리하고분류해모델을구축하고성능향상을위해튜닝하는다양한기법을제공한다.
단순선형회귀분석부터시작해다중회귀분석,로지스틱회귀분석그리고라소리지회귀분석,베이지안회귀분석,회귀트리,베깅및부스팅등의고급회귀분석에이르기까지다양한방법을기술한다.또한이를위해데이터를올바르게준비하고,모델이최상의성능을발휘할수있도록데이터를처리하는방법에대해서도설명한다.
이러한모든기법은예제와함께제시되며,각예제는데이터분석에많은강점을가지고있는파이썬코드를사용해쉽게이해할수있도록구성돼있다.
또한후반부에제시된실용적인사례는구체적인문제해결방법을단계적으로제시하고있어실생활에서발생할수있는유사한문제에대한청사진으로활용할수있을것이다.