XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 (캐글 고수에게 배우는 실전 파이썬 머신러닝, 코랩에서 실습 가능)

XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 (캐글 고수에게 배우는 실전 파이썬 머신러닝, 코랩에서 실습 가능)

$34.00
Description
캐글 우승자들의 머신러닝 우승 비법이자 현존하는 가장 우월한 머신러닝 모델 XGBoost
이 책은 기본적인 머신러닝과 판다스부터 사용자 정의 변환기, 파이프라인과 희소 행렬로 새로운 데이터의 예측을 만드는 강력한 XGBoost 모델 튜닝까지 모두 다룹니다. 또한 XGBoost의 탄생 배경과 XGBoost를 특별하게 만드는 수학적 이론과 기술, 물리학자와 천문학자가 우주를 연구하는 사례 연구까지 다양한 XGBoost의 흥미로운 이야기와 캐글 마스터들의 우승 비법까지 소개합니다. 마지막으로 더 확실한 이해를 위해 원서에는 없는 친절하고 상세한 역자 노트와 다른 그레이디언트 부스팅 라이브러리를 배울 수 있는 한국어판만의 부록을 추가하여 내용을 더욱 가득 채웠습니다. 이 책 한 권이면 복잡한 XGBoost 개념을 완벽하게 이해하고 제품을 위한 머신러닝을 구축해볼 수 있게 됩니다. 그레이디언트 부스팅을 현업에 적용해보고 싶은 머신러닝 엔지니어나 캐글 대회를 준비하고 있는 캐글 도전자에게 훌륭한 안내서가 되어줄 것입니다
저자

코리웨이드

CoreyWade
수학과예술분야석사이고버클리코딩아카데미(BerkeleyCodingAcademy)의설립자이자이사로전세계10대들에게머신러닝과인공지능을가르치고있습니다.또한코리는버클리고등학교독립학습프로그램의수학분야의장으로서프로그래밍과고등수학을가르치고있습니다.기초적인자연어처리를가르치며,패스스트림(Pathstream)과데이터과학커리큘럼을개발하고,투워드데이터사이언스(TowardsDataScience),스프링보드(Springboard),미디엄(Medium)에통계학과머신러닝글을기고합니다.『ThePythonWorkshop』(Packt,2019)의공동저자이기도합니다.

목차

CHAPTER0코딩환경설정
0.1아나콘다
0.2주피터노트북사용하기
0.3XGBoost
0.4버전

PART1배깅과부스팅

CHAPTER1머신러닝개요
1.1XGBoost소개
1.2데이터랭글링
1.3회귀모델만들기
1.4분류모델만들기
1.5마치며

CHAPTER2결정트리
2.1결정트리소개
2.2결정트리알고리즘
2.3분산과편향
2.4결정트리하이퍼파라미터튜닝
2.5심장질환예측하기-사례연구
2.6마치며

CHAPTER3배깅과랜덤포레스트
3.1배깅앙상블
3.2랜덤포레스트살펴보기
3.3랜덤포레스트매개변수
3.4랜덤포레스트성능높이기-사례연구
3.5마치며

CHAPTER4그레이디언트부스팅에서XGBoost까지
4.1배깅에서부스팅까지
4.2그레이디언트부스팅작동방식
4.3그레이디언트부스팅매개변수튜닝
4.4빅데이터다루기-그레이디언트부스팅vsXGBoost
4.5마치며

PART2XGBoost

CHAPTER5XGBoost소개
5.1XGBoost구조
5.2XGBoost파라미터최적화
5.3XGBoost모델만들기
5.4힉스보손찾기-사례연구
5.5마치며

CHAPTER6XGBoost하이퍼파라미터
6.1데이터와기준모델준비
6.2XGBoost하이퍼파라미터튜닝
6.3조기종료적용
6.4하이퍼파라미터결합
6.5하이퍼파라미터조정
6.6마치며

CHAPTER7XGBoost로외계행성찾기
7.1외계행성찾기
7.2오차행렬분석하기
7.3불균형데이터리샘플링
7.4XGBClassifier튜닝
7.5마치며

PART3고급XGBoost

CHAPTER8XGBoost기본학습기
8.1여러가지기본학습기
8.2gblinear적용하기
8.3dart비교하기
8.4XGBoost랜덤포레스트
8.5마치며

CHAPTER9캐글마스터에게배우기
9.1캐글대회둘러보기
9.2특성공학
9.3상관관계가낮은앙상블만들기
9.4스태킹
9.5마치며

CHAPTER10XGBoost모델배포
10.1혼합데이터인코딩
10.2사용자정의사이킷런변환기
10.3XGBoost모델만들기
10.4머신러닝파이프라인구성하기
10.5마치며

APPENDIXA(한국어판부록)다른그레이디언트부스팅라이브러리
A.1LightGBM
A.2사이킷런의히스토그램기반그레이디언트부스팅
A.3CatBoost

출판사 서평

데이터과학전문가를위한XGBoost와사이킷런활용법

XGBoost는빠르고효율적으로수십억개의데이터포인트에적용하기위한그레이디언트부스팅프레임워크로,업계에서입증된오픈소스소프트웨어라이브러리입니다.이책은그레이디언트부스팅에대한이론을설명하기전에사이킷런으로머신러닝과XGBoost를소개합니다.결정트리를다루고머신러닝관점에서배깅을분석하며XGBoost까지확장되는하이퍼파라미터를배우겠습니다.밑바닥부터그레이디언트부스팅모델을구축해보고그레이디언트부스팅을빅데이터로확장하면서속도의중요성을설명합니다.그리고속도향상및수학적인이론에초점을두고XGBoost의세부사항을알아봅니다.자세한사례연구를이용하여사이킷런API와원본파이썬API방식으로XGBoost분류모델과회귀모델을만들고튜닝하는방법을연습합니다.또한,XGBoost하이퍼파라미터를활용하여성능개선,누락된값수정및불균형데이터세트적용,그리고다른기본학습기를튜닝합니다.마지막으로상관관계가낮은앙상블과스태킹모델을만들어보고,모델배포를위해희소행렬과사용자정의변환기,파이프라인과같은고급XGBoost기술을적용합니다.

주요내용
● 그레이디언트부스팅모델구축
● 정확하고빠른XGBoost회귀및분류모델개발
● XGBoost하이퍼파라미터미세조정측면에서분산및편향분석
● 상관관계가없는앙상블을구축하고XGBoost모델을스태킹하여정확성향상
● 다트,선형모델및XGBoost랜덤포레스트와같은기본학습기적용
● 사용자정의변환기와파이프라인을사용한XGBoost모델배포
● 누락된값자동수정및불균형데이터조정