Kaggle 우승작으로 배우는 머신러닝 탐구생활

Kaggle 우승작으로 배우는 머신러닝 탐구생활

$29.44
저자

정권우

지은이:정권우
카네기멜론대학교응용수학과학부를졸업했다.5살부터유초중고시절을일본도쿄에서보내고,대학교를미국으로진학한덕분에한국어,일본어,영어가능통하다.

대학에서는금융수학을전공한후UBSSeoul,JPMorganTokyo지사에서사회생활을시작했다.대학교2학년때처음으로접한프로그래밍에관심을갖게되어,휴학후한국에서의병역특례군복무시절머신러닝을독학으로공부했다.캐글경진대회를통해머신러닝을배웠으며,글로벌캐글랭킹이그사람의머신러닝능력을대변한다고믿는다.캐글본사의허락하에,공식블로그를한글로번역하고있으며,2016년12월에는패스트캠퍼스에서"파이썬을활용한머신러닝프로젝트CAMP"강사로캐글경진대회를활용하여실무머신러닝기술을가르쳤다.

모바일콘텐츠플랫폼카카오페이지를운영하는다음카카오의자회사포도트리를거쳐,P2P투자기업8퍼센트의챗봇을개발한데이터나다에서머신러닝엔지니어로근무한경력이있다.지금은네이버파파고팀에서딥러닝을통해더나은번역기를개발하는일을하고있다.  

목차

1장파이썬과머신러닝그리고캐글
1.1왜파이썬인가
1.2왜캐글인가?
1.3캐글을시작하는방법
1.4경진대회에통하는실질적인팁
1.5경진대회선별기준

2장산탄데르제품추천경진대회
2.1경진대회소개
2.2경진대회주최자의동기
2.3평가척도
2.4주요접근
2.5데이터준비하기
2.6탐색적데이터분석
2.7Baseline모델
2.8승자의지혜-8등소스코드분석
2.9승자의지혜

3장텐서플로음성인식경진대회
3.1경진대회소개
3.2경진대회주최자의동기
3.3평가척도
3.4주요접근
3.5데이터준비하기
3.6탐색적데이터분석
3.7Baseline모델
3.8승자의지혜-3등소스코드분석
3.9승자의지혜

4장포르토세구로안전운전자예측경진대회
4.1경진대회소개
4.2경진대회주최자의동기
4.3평가척도
4.4주요접근
4.5데이터준비하기
4.6탐색적데이터분석
4.7Baseline모델
4.8승자의지혜-2등소스코드분석
4.9승자의지혜

5장스테이트팜산만한운전자감지경진대회
5.1경진대회소개
5.2경진대회주최자의동기
5.3평가척도
5.4주요접근
5.5데이터준비하기
5.6탐색적데이터분석
5.7Baseline모델
5.8성능개선실험
5.9승자의지혜

출판사 서평

파이썬을활용한머신러닝실전예제분석



이책은과거캐글경진대회에서제공된실제데이터를다룬다.머신러닝을시작하기위하여두껍고어려운선형대수,미적분,통계책을읽기시작하여고통받고있는독자를위하여,이책은더재미있고피부에와닿는실제경진대회를통해머신러닝을배울수있도록돕고자한다.



먼저,경진대회에출제된문제를올바르게이해하고,데이터시각화과정을통해데이터에대한이해를쌓아간다.그리고높은순위를기록한상위입상자의코드를직접분석하고피쳐엔지니어링,모델튜닝,교차검증기법을독자가직접재현할수있도록돕는다.이책을통해독자는"성공적인머신러닝파이프라인"이무엇인지를배우게될것이다.




이책의특징

-캐글경진대회상위입상자의코드를한땀한땀분석한다.

-실제업계에서사용하는Tabular데이터,이미지데이터,텍스트데이터,음성데이터를직접다룬다.

-최신머신러닝모델(XGBoost,LightGBM,CatBoost,PyTorch)을사용해본다.




독자대상

초중급




소스코드다운로드

https://github.com/bjpublic/kaggleml



캐글은2010년에설립된머신러닝경진대회플랫폼이다.기업과연계하여주최되는경진대회를통해머신러닝문제와데이터가제공되면,캐글에가입한데이터분석가,통계학자,머신러닝엔지니어등의개개인이모여가장높은점수를내기위해경쟁하는구조이다.기업은우승자의코드와분석기법을토대로기업이보유한내부머신러닝알고리즘을고도화할수있는기회를얻게되고,개인들은평소에접할수없는데이터를직접다루는기회를얻으며,상위입상시고액의상금을얻는다.



아마존,페이스북,구글등모두가아는IT기업들도캐글에경진대회를개최한경험이있다.세계최고수준의머신러닝알고리즘을구현하는기업,구글딥마인드에서도파이썬을활용한캐글경진대회에서우수한성적을거두면자연스럽게쌓아갈수있는풍부한경험과지식을채용1순위기준으로삼고있다.이책은전세계에서인정받을수있는머신러닝엔지니어업무를커리어로삼고싶은독자들을위한책이다.