파이썬 머신러닝 완벽 가이드 (개정2판)

파이썬 머신러닝 완벽 가이드 (개정2판)

$42.83
Description
자세한 이론 설명과 파이썬 실습을 통해 머신러닝을 완벽하게 배울 수 있습니다!
《파이썬 머신러닝 완벽 가이드》는 이론 위주의 머신러닝 책에서 탈피해, 다양한 실전 예제를 직접 구현해 보면서 머신러닝을 체득할 수 있도록 만들었습니다. 캐글과 UCI 머신러닝 리포지토리에서 난이도가 있는 실습 데이터를 기반으로 실전 예제를 구성했고, XGBoost, LightGBM, 스태킹 기법 등 캐글의 많은 데이터 사이언스에서 애용하는 최신 알고리즘과 기법을 상세하게 설명했습니다.

이번 개정2판에서는 최신 사이킷런 버전(1.0.2)을 포함해 책에서 사용되는 모든 라이브러리를 최신 버전으로 업그레이드한 실습 코드를 구현하고, 다양한 유형의 하이퍼파라미터를 가지는 XGBoost나 LightGBM 모델의 최적 하이퍼파라미터 튜닝을 위한 베이지안 최적화 기법 적용 실습을 제공합니다. 또한 머신러닝 관련 데이터 분석에 널리 쓰이는 시각화 라이브러리인 matplotlib과 seaborn의 활용법을 다룬 장을 새롭게 추가했습니다.

저자

권철민


저자:권철민
엔코아컨설팅,한국오라클을거쳐현재kxsystems에서고성능인메모리DB인kdb+의MachineLearning컨설턴트로근무중이다.지난20년간50여개이상의주요고객사에서데이터컨설팅분야에매진해왔으며,최근몇년간은AI기반의AdvancedAnalytics분야에집중하고있다.직접구현해보지않으면절대이해하지못하는평범한두뇌의소유자이며,절망적인프로젝트에참여해자기학대적인노력으로문제를해결하는이상한성격의소유자이기도하다.

목차


▣1장:파이썬기반의머신러닝과생태계이해
01.머신러닝의개념
___머신러닝의분류
___데이터전쟁
___파이썬과R기반의머신러닝비교
02.파이썬머신러닝생태계를구성하는주요패키지
___파이썬머신러닝을위한S/W설치
03.넘파이
___넘파이ndarray개요
___ndarray의데이터타입
___ndarray를편리하게생성하기-arange,zeros,ones
___ndarray의차원과크기를변경하는reshape()
___넘파이의ndarray의데이터세트선택하기-인덱싱(Indexing)
___행렬의정렬-sort()와argsort()
___선형대수연산-행렬내적과전치행렬구하기
04.데이터핸들링-판다스
___판다스시작-파일을DataFrame으로로딩,기본API
___DataFrame과리스트,딕셔너리,넘파이ndarray상호변환
___DataFrame의칼럼데이터세트생성과수정
___DataFrame데이터삭제
___Index객체
___데이터셀렉션및필터링
___정렬,Aggregation함수,GroupBy적용
___결손데이터처리하기
___applylambda식으로데이터가공
05.정리

▣2장:사이킷런으로시작하는머신러닝
01.사이킷런소개와특징
02.첫번째머신러닝만들어보기-붓꽃품종예측하기
03.사이킷런의기반프레임워크익히기
___Estimator이해및fit(),predict()메서드
___사이킷런의주요모듈
___내장된예제데이터세트
04.ModelSelection모듈소개
___학습/테스트데이터세트분리-train_test_split()
___교차검증
___GridSearchCV-교차검증과최적하이퍼파라미터튜닝을한번에111
05.데이터전처리
___데이터인코딩
___피처스케일링과정규화
___StandardScaler
___MinMaxScaler
___학습데이터와테스트데이터의스케일링변환시유의점
06.사이킷런으로수행하는타이타닉생존자예측
07.정리

▣3장:평가
01.정확도(Accuracy)
02.오차행렬
03.정밀도와재현율
___정밀도/재현율트레이드오프
___정밀도와재현율의맹점
04.F1스코어
05.ROC곡선과AUC
06.피마인디언당뇨병예측
07.정리

▣4장:분류
01.분류(Classification)의개요
02.결정트리
___결정트리모델의특징
___결정트리파라미터
___결정트리모델의시각화
___결정트리과적합(Overfitting)
___결정트리실습-사용자행동인식데이터세트
03.앙상블학습
___앙상블학습개요
___보팅유형-하드보팅(HardVoting)과소프트보팅(SoftVoting)
___보팅분류기(VotingClassifier)
04.랜덤포레스트
___랜덤포레스트의개요및실습
___랜덤포레스트하이퍼파라미터및튜닝
___GBM의개요및실습
05.GBM(GradientBoostingMachine)
___GBM하이퍼파라미터소개
___XGBoost개요
06.XGBoost(eXtraGradientBoost)
___XGBoost설치하기
___파이썬래퍼XGBoost하이퍼파라미터
___파이썬래퍼XGBoost적용-위스콘신유방암예측
___사이킷런래퍼XGBoost의개요및적용
07.LightGBM
___LightGBM설치
___LightGBM하이퍼파라미터
___하이퍼파라미터튜닝방안
___파이썬래퍼LightGBM과사이킷런래퍼XGBoost,
___LightGBM하이퍼파라미터비교
___LightGBM적용-위스콘신유방암예측
08.베이지안최적화기반의HyperOpt를이용한하이퍼파라미터튜닝
___베이지안최적화개요
___HyperOpt사용하기
___HyperOpt를이용한XGBoost하이퍼파라미터최적화
09.분류실습-캐글산탄데르고객만족예측
___데이터전처리
___XGBoost모델학습과하이퍼파라미터튜닝
___LightGBM모델학습과하이퍼파라미터튜닝
10.분류실습-캐글신용카드사기검출
___언더샘플링과오버샘플링의이해
___데이터일차가공및모델학습/예측/평가
___데이터분포도변환후모델학습/예측/평가
___이상치데이터제거후모델학습/예측/평가
___SMOTE오버샘플링적용후모델학습/예측/평가
11.스태킹앙상블
___기본스태킹모델
___CV세트기반의스태킹
12.정리

▣5장:회귀
01.회귀소개
02.단순선형회귀를통한회귀이해
03.비용최소화하기-경사하강법(GradientDescent)소개
04.사이킷런LinearRegression을이용한보스턴주택가격예측
___LinearRegression클래스-OrdinaryLeastSquares
___회귀평가지표
___LinearRegression을이용해보스턴주택가격회귀구현
05.다항회귀와과(대)적합/과소적합이해
___다항회귀이해
___다항회귀를이용한과소적합및과적합이해
___편향-분산트레이드오프(Bias-VarianceTradeoff)
06.규제선형모델-릿지,라쏘,엘라스틱넷
___규제선형모델의개요
___릿지회귀
___라쏘회귀
___엘라스틱넷회귀
___선형회귀모델을위한데이터변환
07.로지스틱회귀
08.회귀트리
09.회귀실습-자전거대여수요예측
___데이터클렌징및가공과데이터시각화
___로그변환,피처인코딩과모델학습/예측/평가
10.회귀실습-캐글주택가격:고급회귀기법
___데이터사전처리(Preprocessing)
___선형회귀모델학습/예측/평가
___회귀트리모델학습/예측/평가
___회귀모델의예측결과혼합을통한최종예측
___스태킹앙상블모델을통한회귀예측
11.정리

▣6장:차원축소
01.차원축소(DimensionReduction)개요
02.PCA(PrincipalComponentAnalysis)
___PCA개요
03.LDA(LinearDiscriminantAnalysis)
___LDA개요
04.SVD(SingularValueDecomposition)
___SVD개요
___사이킷런TruncatedSVD클래스를이용한변환
05.NMF(Non-NegativeMatrixFactorization)
___NMF개요
06.정리

▣7장:군집화
01.K-평균알고리즘이해
___사이킷런KMeans클래스소개
___K-평균을이용한붓꽃데이터세트군집화
___군집화알고리즘테스트를위한데이터생성
02.군집평가(ClusterEvaluation)
___실루엣분석의개요
___붓꽃데이터세트를이용한군집평가
___군집별평균실루엣계수의시각화를통한군집개수최적화방법
03.평균이동
___평균이동(MeanShift)의개요
04.GMM(GaussianMixtureModel)
___GMM(GaussianMixtureModel)소개
___GMM을이용한붓꽃데이터세트군집화
___GMM과K-평균의비교
05.DBSCAN
___DBSCAN개요
___DBSCAN적용하기-붓꽃데이터세트
___DBSCAN적용하기-make_circles()데이터세트
06.군집화실습-고객세그먼테이션
___고객세그먼테이션의정의와기법
___데이터세트로딩과데이터클렌징
___RFM기반데이터가공
___RFM기반고객세그먼테이션
07.정리

▣8장텍스트분석
___NLP이냐텍스트분석이냐?
01.텍스트분석이해
___텍스트분석수행프로세스
___파이썬기반의NLP,텍스트분석패키지
02.텍스트사전준비작업(텍스트전처리)-텍스트정규화
___클렌징
___텍스트토큰화
___스톱워드제거
___Stemming과Lemmatization
03.BagofWords-BOW
___BOW피처벡터화
___사이킷런의Count및TF-IDF벡터화구현:CountVectorizer,TfidfVectorizer
___BOW벡터화를위한희소행렬
___희소행렬-COO형식
___희소행렬-CSR형식
04.텍스트분류실습-20뉴스그룹분류
___텍스트정규화
___피처벡터화변환과머신러닝모델학습/예측/평가
___사이킷런파이프라인(Pipeline)사용및GridSearchCV와의결합
05.감성분석
___감성분석소개
___지도학습기반감성분석실습-IMDB영화평
___비지도학습기반감성분석소개
___SentiWordNet을이용한감성분석
___VADER를이용한감성분석
06.토픽모델링(TopicModeling)-20뉴스그룹
07.문서군집화소개와실습(OpinionReview데이터세트)
___문서군집화개념
___OpinionReview데이터세트를이용한문서군집화수행하기
___군집별핵심단어추출하기
08.문서유사도
___문서유사도측정방법-코사인유사도
___두벡터사잇각
___OpinionReview데이터세트를이용한문서유사도측정
09.한글텍스트처리-네이버영화평점감성분석
___한글NLP처리의어려움
___KoNLPy소개
___데이터로딩
10.텍스트분석실습-캐글MercariPriceSuggestionChallenge
___데이터전처리
___피처인코딩과피처벡터화
___릿지회귀모델구축및평가
___LightGBM회귀모델구축과앙상블을이용한최종예측평가
11.정리

▣9장:추천시스템
01.추천시스템의개요와배경
___추천시스템의개요
___온라인스토어의필수요소,추천시스템
___추천시스템의유형
02.콘텐츠기반필터링추천시스템
03.최근접이웃협업필터링
04.잠재요인협업필터링
___잠재요인협업필터링의이해
___행렬분해의이해
___확률적경사

출판사 서평

이책의특징

◎분류,회귀,차원축소,클러스터링등핵심머신러닝알고리즘에대한깊이있는설명
◎데이터전처리,머신러닝알고리즘적용,하이퍼파라미터튜닝,성능평가등최적머신러닝모델구성방안제시
◎XGBoost,LightGBM,스태킹등머신러닝최신기법에대한상세한설명과활용법
◎난이도높은캐글문제를직접따라해보면서실무머신러닝애플리케이션개발방법체득(산탄테르은행고객만족예측,신용카드사기검출,부동산가격예측고급회귀기법,Mercari쇼핑몰가격예측등)
◎텍스트분석과NLP를위한기반이론과다양한실습예제제공(텍스트분류,감성분석,토픽모델링,문서유사도,문서군집화와유사도,KoNLPy를이용한네이버영화감성분석등)
다양한추천시스템을직접파이썬코드로구축하는법을제공