파이썬으로 구현하는 고급 머신 러닝 (딥러닝을 포함한 최신 고급 머신 러닝 기술과 파이썬 활용)

파이썬으로 구현하는 고급 머신 러닝 (딥러닝을 포함한 최신 고급 머신 러닝 기술과 파이썬 활용)

$33.73
Description
과거 오랜 기간 어려움을 겪었던 문제의 해결 방안이 등장하면서 최근 몇 년 사이 머신 러닝 분야는 발전 속도는 가히 폭발적이다. 특히 신경망 기반 접근 방법은 딥러닝이라는 기술로 큰 도약을 이뤘다 하겠다. 이 책에서는 이러한 머신 러닝에서 폭넓게 사용되는 핵심 알고리즘을 비롯해 최근 각광받고 있는 다양한 딥러닝 관련 대표 알고리즘들을 친절하고 자세하게 설명한다. 이미지 분류 등에서 높은 성능 향상을 보인 컨볼루션 신경망(CNN) 외에도 제한된 볼츠만 머신(RBM), 심층 신뢰망(DBN), SdA 등을 예제 데이터와 파이썬 코드를 이용해 직접 익힐 수 있게 한다. 뿐만 아니라 캐글(Kaggle)에서 높은 성능을 보인 기법도 쉽게 참고할 수 있게 한 점이 돋보인다. 참고 문헌으로 제공하는 풍부한 연구 지식을 통해서도 실력을 향상시킬 수 있을 것으로 기대한다.
저자

존하티

저자존하티는디지털회사의컨설턴트로,데이터사이언스와인프라스트럭처엔지니어링분야의전문가다.모바일게임에서부터미국자동차보험회사인콘솔분석에AAA관련된고난도의문제까지다뤄왔다.
고급머신러닝기술을실제문제에적용하기시작하면서XBox플랫폼에서플레이어모델링기능과대규모데이터인프라스트럭처를개발하기위해마이크로소프트와계약을체결했다.그가속한팀은엔지니어링,데이터과학분야에서획기적인진전을이루며,결과물에대해MicrosoftStudio에서복제해가기도했다.
이러한경험을통해결국존은새로운통찰력이나데이터에기반을둔역량을추구하는국내외고객을위한포괄적인인프라및분석솔루션을제공하는컨설턴트가됐다.그가현재가장의욕적으로수행중인계약프로젝트는주요소셜네트워크에대한예측분석모델을만들고사용자들간의연결관계에대한중요성을정량화하는것이다.수년간데이터작업에몰두한결과존은끊임없는질문을통해궁금증을해결하려고한다.개인적인관심사를충족시키기위해파이썬으로매일매일ML솔루션을개발하고있다.여기에는StyleNetcomputationalcreativity알고리즘의파생버전과algo-trading및geolocation기반의추천등을위한솔루션이포함돼있다.

목차

1장.비지도머신러닝
__주성분분석(PCA)
____PCA:기초
____PCA활용
__K-평균클러스터링
____클러스터링:기초
____클러스터링분석
____클러스터링환경변수튜닝
__SOM(Self-organizingmaps)
____SOM알고리즘의기초
____SOM알고리즘활용
__참고문헌
__요약

2장.심층신뢰망(DBN)
__신경망:기본개념
____신경망의구성
____네트워크토폴로지
__제한된볼츠만머신(RBM)
____RBM의소개
______토폴로지
______학습
____RBM애플리케이션
____RBM애플리케이션추가사항
__심층신뢰망(DBN)
____DBN학습
____DBN애플리케이션
____DBN검증
__참고문헌
__요약

3장.SdA
__오토인코더
____오토인코더소개
______토폴로지
______학습
____dA
____dA응용
__SdA
____SdA응용
____SdA성능평가
__참고문헌
__요약

4장.컨볼루션신경망(CNN)
__CNN의소개
____컨볼루션신경망토폴로지
______컨볼루션레이어
______풀링레이어
______convnet학습
______종합정리
____CNN의응용
__참고문헌
__요약

5장.준지도학습
__소개
__준지도학습의이해
__준지도학습알고리즘의실제
____자가학습
______자가학습구현
______자가학습구현에대한세부조정
__CPLE
__참고문헌
__요약

6장.텍스트피처엔지니어링
__소개
__텍스트피처엔지니어링
____텍스트데이터정제
______BeautifulSoup을이용한텍스트정제
______구두점과토큰화관리
______단어의태깅및카테고리화
____텍스트데이터에서피처생성
____어근추출
____배깅과랜덤포레스트
____준비된데이터의테스팅
__참고문헌
__요약

7장.피처엔지니어링II
__소개
__피처세트생성
____머신러닝애플리케이션을위한피처엔지니어링
______피처의학습정도향상을위한리스케일링기술의이용
______도출된변수의효과적인생성
______숫자가아닌피처의재해석
____피처셀렉션기술의이용
______피처셀렉션수행
__실제문제에서피처엔지니어링
____RESTfulAPI를통한데이터확보
______모델의성능테스트
______트위터
______피처엔지니어링기술을이용한변수도출및선택
__참고문헌
__요약

8장.앙상블기법
__앙상블의소개
____평준화기법
______배깅알고리즘을이용
______랜덤포레스트를사용
____부스팅기법응용
______XGBoost를이용
______스태킹앙상블사용
____실제문제에앙상블응용
__다이내믹애플리케이션에서모델사용
____모델로버스트니스이해
______위험요소모델링파악
____모델로버스트니스관리전략
__참고문헌
__요약

9장.파이썬머신러닝관련추가툴
__대안개발툴
____라자냐소개
______라자냐학습
____텐서플로소개
______텐서플로학습
______모델을반복적으로향상시키기위한텐서플로사용
____라이브러리사용시알아둘점
__참고문헌
__요약

출판사 서평

■첨단딥러닝알고리즘에대한실질적이고이론적인이해를돕기위한최고수준의데이터과학자의성과비교
■모든기술에대해깔끔하게설명된코드와테스트실행결과를통해신규기술이실제로접할수있는문제의적용과해결
■대규모의복잡한데이터자동화와이를통해장시간작업을필요로하는문제점의극복방안
■강력한피처엔지니어링기술을사용한기존의입력데이터와분석모델의정확도향상방법
■분석결과의일관성을향상시키기위한여러가지학습기술활용방법
■폭넓은비지도학습기법을이용해데이터셋에숨겨진패턴/구조분석과이해
■어렵고과감한도전이필요한문제에대한전문가들의효과적이고반복적으로검증에초점을맞춘방법소개
■여러가지분석모델을함께묶어활용하는강력한앙상블기술을통해딥러닝모델을더효과적으로만드는방법

★이책의대상독자★
최근몇년사이급부상한고급분석모델링기술에초점을맞춰이책을읽기바란다.이책은많은경험을보유한데이터과학자와기존기술을새로운환경에적용하려는개발자에상관없이고급분석알고리즘을공부하고자하는독자모두를대상으로한다.

★이책의구성★
1장,'비지도머신러닝'에서는데이터셋에담긴패턴과구조를파악하기위해비지도학습을어떻게적용하는지알아본다.
2장,'DBN(DeepBeliefNetworks)'에서는RBM과DBN알고리즘이어떻게동작하는지자세히설명한다.이를어떻게사용하는지알게될것이다.그리고결과에대한퀄리티를향상시킬수있는능력도확실히얻을수있을것이다.
3장,'SdA'에서는고차원입력데이터의피처모델학습에SdA를적용하는방법을통해딥아키텍처형태로모델을만드는방법을계속살펴본다.
4장,'컨볼루션신경망(CNN)'에서는컨볼루션신경망(Convnet)를어떻게적용하는지소개한다.
5장,'준지도학습'에서는다양한준지도학습을어떻게적용하는지설명한다.주요기법으로는CPLE,자가학습(self-learning),S3VM등이있다
6장,'텍스트피처엔지니어링'에서는앞에서다룬모델에대한효과를더욱높일수있도록데이터를잘준비하는기술에대해알아본다.
7장,'피처엔지니어링II'에서는(1)데이터퀄리티문제를완화하거나,(2)머신러닝에도움이되는형식으로데이터를변환하든지,또는(3)해당데이터를창의적으로향상시키기위해데이터를자세히조사하고정보를얻는방법등을소개한다.
8장,'앙상블기법'에서는세련된모델앙상블을구현하는방법과분석모델솔루션에대한로버스트니스를갖게하는기법등을살펴본다.
9장,'파이썬머신러닝관련추가툴'에서는우선데이터과학자가사용할수있는최신툴중어떤것들이있는지자세히알아본다.또한이러한툴이어떤장점이있는지도확인한다.이외에도이책의앞부분에서소개하는툴과기술을일관된작업프로세스에어떻게적용하는지에대해서도살펴본다.
부록,'장별코드준비사항'에서는장별로준비해야하는라이브러리들과이책을학습하는데필요한툴을요약정리한다.