머신러닝·딥러닝 문제해결 전략 - Must Have

머신러닝·딥러닝 문제해결 전략 - Must Have

$40.19
Description
문제해결 방식에 정답은 없어도 패턴은 있습니다.
이 책에는 수많은 캐글 수상자의 노트북을 리팩터링하며 찾아낸 공통된 패턴이 담겨 있습니다. 이 책과 함께 체계적인 머신러닝·딥러닝 문제해결 프로세스를 숙달해보세요. 단순 따라하기에서 벗어나 어떤 점을 분석해야 하는지, 분석 결과를 어떻게 적용하는지, 이 기법이 왜 유용하고 어떻게 활용하는지까지 친절하게 알려드립니다. 기본이 몸에 익으면 새로운 문제가 주어져도 쉽게 응용할 수 있습니다. 엄선한 7가지 대회와 별책부록인 〈공략집〉을 통해 기본기와 문제해결 능력을 확실하게 길러드립니다.

저자

신백균

저자:신백균
KAIST산업및시스템공학과졸업후한국생산성본부에서직무교육기획및운영을담당하는전문위원입니다.세계랭킹0.18%의캐글노트북엑스퍼트(Expert)이며,월평균6만여명이방문하는데이터분석/머신러닝관련기술블로그를운영하고있습니다.참여자1,200명이상인머신러닝관련오픈채팅방의운영진이기도합니다.

목차

[1부]머신러닝레벨업의지름길,캐글
01장왜캐글인가?
__1.1왜캐글을해야하는가?
__1.2캐글구성요소
__1.3캐글러등급
__학습마무리

02장캐글정복첫걸음
__2.1캐글가입
__2.2경진대회참여
__2.3주피터노트북설정
__2.4결과제출하기
__2.5컨트리뷰터되기
__2.6예제코드캐글노트북복사하기
__학습마무리

03장문제해결프로세스및체크리스트
__3.1머신러닝문제해결프로세스
__3.2머신러닝문제해결체크리스트
__3.3딥러닝문제해결프로세스
__3.4딥러닝문제해결체크리스트

04장데이터를한눈에:주요시각화그래프
__4.1데이터종류
__4.2탐색적데이터분석과그래프
__4.3수치형데이터시각화
__4.4범주형데이터시각화
__4.5데이터관계시각화


[2부]머신러닝문제해결

05장다시살펴보는머신러닝주요개념
__5.1분류와회귀
__5.2분류평가지표
__5.3데이터인코딩
__5.4피처스케일링
__5.5교차검증
__5.6주요머신러닝모델
__5.7하이퍼파라미터최적화

06장[경진대회]자전거대여수요예측★☆☆
__6.1경진대회이해
__6.2경진대회접속방법및세부메뉴
__6.3탐색적데이터분석
__분석정리및모델링전략
__6.4베이스라인모델
__6.5성능개선I:릿지회귀모델
__6.6성능개선II:라쏘회귀모델
__6.7성능개선III:랜덤포레스트회귀모델
__학습마무리
__실전문제

07장[경진대회]범주형데이터이진분류★★☆
__7.1경진대회이해
__7.2탐색적데이터분석
__분석정리및모델링전략
__7.3베이스라인모델
__7.4성능개선I
__7.5성능개선II
__학습마무리
__실전문제

08장[경진대회]안전운전자예측★★☆
__8.1경진대회이해
__8.2탐색적데이터분석
__분석정리및모델링전략
__8.3베이스라인모델
__8.4성능개선I:LightGBM모델
__8.5성능개선II:XGBoost모델
__8.6성능개선III:LightGBM과XGBoost앙상블
__학습마무리

09장[경진대회]향후판매량예측★★★
__9.1경진대회이해
__9.2탐색적데이터분석
__분석정리및모델링전략
__9.3베이스라인모델
__9.4성능개선
__9.5머신러닝경진대회를마치며
__학습마무리


[3부]딥러닝문제해결

10장다시살펴보는딥러닝주요개념
__10.1인공신경망
__10.2합성곱신경망(CNN)
__10.3성능향상을위한딥러닝알고리즘

11장[경진대회]항공사진내선인장식별★☆☆
__11.1경진대회이해
__11.2탐색적데이터분석
___분석정리및모델링전략
__11.3베이스라인모델
__11.4성능개선
___학습마무리

12장[경진대회]병든잎사귀식별★★☆
__12.1경진대회이해
__12.2탐색적데이터분석
___분석정리및모델링전략
__12.3베이스라인모델
__12.4성능개선
___학습마무리
___실전문제

13장[데이터셋]흉부엑스선기반폐렴진단★★☆
__13.1경진대회이해
__13.2탐색적데이터분석
___분석정리및모델링전략
__13.3베이스라인모델
__13.4성능개선
___학습마무리

부록A캐글생활백서
__A.1피처요약표
__A.2메모리절약을위한데이터다운캐스팅
__A.3디버깅을위한간단한팁
__A.4훈련된모델저장하고불러오기

출판사 서평

이책은수많은캐글수상자의노트북을수집/분석하여여러분께공통된문제해결패턴을안내해줍니다.총7개의경진대회를이패턴에따라함께진행하면서자연스럽게효과적인프로세스와전략을체득할수있게꾸렸습니다.

머신러닝·딥러닝문제를하나해결하려면데이터분석부터시작하여적합한모델을설계하고최적화를반복하는긴여정을완주해야합니다.체계적인프로세스를따르더라도몸에익기전까지는도중에길을잃기쉽다는뜻입니다.

그래서여러분이외롭게표류하지않게끔책자체의구성은물론외적으로도여러장치를마련했습니다.대표적으로〈공략집〉과〈미니맵〉,〈체크리스트〉가있습니다.

공략집(with미니맵)
공략집은두꺼운이책을초심자도잘따라오실수있도록안내하는별책부록입니다.월드맵(책의전체구성)과미니맵(장별구성)을통해,항상숲을보면서나의위치와집중할영역을분명하게알수있도록도와드립니다.저자깃허브에서최신버전을확인하실수있습니다.

체크리스트
문제해결과정에서짚어봐야할사항들을프로세스단계별로정리한표입니다.저자깃허브에서최신버전을확인하실수있습니다.사본을만드신후자유롭게수정·개선하여여러분만의비밀무기로활용해주세요.

책의구성

이책은총3부로구성됩니다.1부에서는머신러닝·딥러닝문제해결역량을키우는데캐글이최적인이유를알아보고,2부와3부에서본격적으로대회를공략하는데필요한채비를갖춥니다.

1장과2장은캐글소개와튜토리얼이니캐글에이미익숙하신분은건너뛰어도크게상관없습니다.3장은중요합니다.바로이책에서반복숙달할문제해결프로세스의틀을설명하기때문입니다.상위권캐글러들의공통된패턴을정리한것이니한번씩꼼꼼히정리해보시면좋을것같습니다.4장은데이터유형을나누고각유형에유용한시각화기법들을간단히소개합니다.

2부에서는머신러닝모델을사용하는캐글경진대회에익숙해질수있습니다.먼저머신러닝의주요개념들을정리해본다음,총4개의경진대회를공략하면서머신러닝프로젝트방법론을터득하게됩니다.중점적으로익힐내용이학습흐름과난이도에맞춰분배되도록경진대회들을선별해배치했습니다.2부부터는본격적인문제해결에나서는만큼별책부록인공략집의미니맵이큰도움이되리라생각합니다.

마지막3부에서는비정형데이터를,그중에서도이미지데이터를분류하는딥러닝문제들을공략합니다.전체적인구성방식은2부와같습니다.대회를하나하나정복할수록레벨업되는느낌이확실히느껴지도록구성했습니다.