머신 러닝 알고리즘 (파이썬 예제와 함께 배우는 머신 러닝)

머신 러닝 알고리즘 (파이썬 예제와 함께 배우는 머신 러닝)

$35.44
Description
머신 러닝에 대한 소개와 파이썬 활용 방법을 소개하고 있다. 단계별로 다음과 같은 머신 러닝 알고리즘을 쉽게 구현할 수 있는 방법에 대해 배울 수 있다.

1. 데이터 기반 애플리케이션에 사용되는 통계와 수학 이론
2. EM 알고리즘, PCA, 베이지안 회귀 등의 기술
3. 다양한 데이터를 이용한 패턴 인식과 예측
저자

주세페보나코르소

12년이상의경력을겸비한머신러닝및빅데이터컨설턴트다.이탈리아카타니아대학(UniversityofCatania)전자공학과에서학위를받았다.이후이탈리아토르베르가타(TorVergata)의로마대학및영국에식스(Essex)대학에서대학원전문과정을이수했다.
공공행정,군대,공공시설,의료,진단및광고등다양한비즈니스환경에서IT경력을쌓았다.또한자바(Java),파이썬(Python),하둡(Hadoop),스파크(Spark),테아노(Theano)및텐서플로(TensorFlow)를비롯한많은기술을사용해프로젝트를수행하고관리한경험이있다.주요관심사는인공지능,머신러닝,데이터과학및철학분야다.

목차

지은이소개
기술감수자소개
옮긴이소개
옮긴이의말
들어가며

1장.머신러닝개요

__소개-초기의기계
__학습
__지도학습
____비지도학습
____강화학습
__머신러닝을넘어서:딥러닝과생체-적응시스템
__머신러닝과빅데이터
__심화학습
__요약

2장.머신러닝의핵심요소

__데이터형식
____멀티클래스전략
________일대다
________일대일
__학습능력
____부적합과과적합
____오류측정
____PAC학습
__통계적학습접근
____MAP학습
____최대-우도학습
__정보이론의요소
__참고문헌
__요약

3장.특징선택과특징엔지니어링

scikit-learn토이데이터셋
__훈련및테스트집합만들기
__범주형데이터관리
__누락된특징관리
__데이터스케일링및정규화
__특징선택및필터링
__주성분분석
____음수미포함행렬분해
____희소PCA
____커널PCA
__원자추출및딕셔너리학습
__참고문헌
__요약

4장.선형회귀

__선형모델
__2차원예제
__scikit-learn을이용한고차원선형회귀
____회귀분석표현
__릿지,라소및엘라스틱넷
__랜덤샘플합의-기반견고한회귀
__다항회귀
__이소토닉회귀
__참고문헌
__요약

5장.로지스틱회귀

__선형분류
__로지스틱회귀
__구현및최적화
__확률적경사하강알고리즘
__그리드검색을통해최적의하이퍼파라미터찾기
__분류측정방법
__ROC곡선
__요약

6장.나이브베이즈

__베이지안이론
__나이브베이즈분류기
__scikit-learn에서나이브베이즈
____베르누이나이브베이즈
____다항나이브베이즈
____가우시안나이브베이즈
__참고문헌
__요약

7장.지지벡터머신

__선형지지벡터머신
__scikit-learn구현
____선형분류
____커널-기반분류
________방사형기저함수
________다항식커널
________시그모이드커널
________사용자정의커널
____비선형예
__제어된지지벡터시스템
__지지벡터회귀
__참고문헌
__요약

8장.의사결정나무와앙상블학습

__이진의사결정나무
____이진의사결정
____불순도측정
________지니불순도지수
________교차-엔트로피불순도지수
________오분류불순도지수
____특징중요도
__scikit-learn을이용한의사결정나무분류
__앙상블학습
____랜덤포레스트
________랜덤포레스트에서특징중요도
____아다부스트
____그레이디언트트리부스팅
____투표분류기
__참고문헌
__요약

9장.군집화개요

__군집화기초
____k-평균
________최적군집수찾기
____DBSCAN
____스펙트럼군집화
__실측자료에근거한평가방법
____균질성
____완전성
____조정된랜드지표
__참고문헌
__요약

10장.계층적군집화

__계층적전략
__병합적군집화
____덴드로그램
____scikit-learn에서병합군집화
____연결제약조건
__참고문헌
__요약

11장.추천시스템개요

__나이브사용자-기반시스템
____scikit학습을이용한사용자-기반시스템구현
__콘텐츠-기반시스템
__모델없는(또는메모리-기반)협업필터링
__모델-기반협업필터링
____단일값분해전략
____교대최소자승전략
____아파치스파크MLlib으로최소자승교체하기
__참고문헌
__요약

12장.자연어처리

__NLTK및내장형코사인
____말뭉치예제
__단어바구니전략
____토큰화하기
________문장토큰화
________Word토큰화
____불용어제거
____언어감지
____어간추출
____벡터화
________카운트벡터화
________Tf-idf벡터화
__로이터말뭉치에따른샘플텍스트분류기
__참고문헌
__요약

13장.NLP에서토픽모델링과감정분석

__토픽모델링
____잠재의미분석
____확률적잠재의미분석
____잠재디리클레할당
__감정분석
____NLTK를이용한VADER감정분석
__참고문헌
__요약

14장.딥러닝과텐서플로개요

__딥러닝살펴보기
____인공신경망
____딥아키텍처
________완전연결층
________컨볼루션층
________드롭아웃층
________순환신경망
__텐서플로소개
____그레이디언트계산하기
____로지스틱회귀
____다층퍼셉트론을이용해분류실행하기
____이미지컨볼루션
__케라스내부빨리들여다보기
__참고문헌
__요약

15장.머신러닝아키텍처만들기

__머신러닝아키텍처
____데이터수집
____정규화
____차원축소
____데이터증강
____데이터변환
____모델링/그리드탐색/교차검증
____가시화
____머신러닝아키텍처용scikit-learn도구
________파이프라인
____특징결합
__참고문헌
__요약

찾아보기

출판사 서평

★이책에서다루는내용★

■머신러닝의중요한요소학습.
■특징선택및특징엔지니어링프로세스이해
■선형회귀의성능과오차간상충성(trade-offs)평가
■다양한유형의알고리즘을사용해데이터모델을구축하고해당모델의작동방법이해
■SVM파라미터를최적화하는방법
■군집화실행
■자연어처리와추천시스템의개념이해
■사전지식없이머신러닝아키텍처구축

★이책의대상독자★

머신러닝이처음인사람이나데이터과학분야에입문하고자하는IT전문가를위한것이다.무엇보다파이썬언어에익숙해야한다.더욱이대부분의내용을완전히이해하기위해서는기초수학지식(선형대수학,확률이론)이필요하다.

★이책의구성★

1장,‘머신러닝개요’에서는머신러닝에대해소개하고지능형애플리케이션을만드는데있어가장중요한접근방식의기본개념을설명한다.
2장,‘머신러닝핵심요소’에서는정보이론의몇가지요소와학습능력의개념을포함한가장일반적인머신러닝문제의수학적인개념을설명한다.
3장,‘특징선택및특징엔지니어링’에서는데이터셋을전처리하고가장중요한정보를제공하는특징을선택하며,원데이터의차원을축소하는데사용되는핵심기술인특징선택및특징엔지니어링에대해설명한다.
선형회귀연속선형모델의구조를선형회귀알고리즘에초점을맞춰설명한다.또한릿지(Ridge),라소(Lasso)및엘라스틱넷(ElasticNet)최적화와다른고급기술도다룬다.
5장,‘로지스틱회귀’에서는로지스틱회귀(LogisticRegression)와확률적경사하강알고리즘SGD에초점을맞춰선형분류의개념을소개한다.이외에중요한평가척도를설명한다.
6장,‘나이브베이즈’에서는베이즈(Bayes)확률이론을설명하고,가장널리알려진나이브베이즈(NaiveBayes)분류기구조에대해설명한다.
7장,‘지지벡터머신’에서는선형비선형분류문제에초점을맞춰분류관련알고리즘을소개한다.
8장,‘의사결정나무와앙상블학습’에서는계층적의사결정과정에대해설명하고,의사결정나무분류,부트스트랩,배깅트리,보팅분류기의개념에대해설명한다.
9장,‘군집화’에서는기초군집화의개념을소개하고,k-평균알고리즘을설명하며,최적의군집수를결정하기위한다양한접근방법을소개한다.후반부에서는DBSCAN과같은스펙트럼군집화와같은다른군집화알고리즘에대해설명한다.
10장,‘계층적군집화’에서는9장,‘군집화’에서설명한내용에이어서응집군집화(agglomerativeclustering)의개념을소개한다.
11장,‘추천시스템개요’에서는추천시스템에서가장잘알려진알고리즘인추천시스템에대해설명한다.이시스템에는콘텐츠-기반및사용자-기반전략,협업필터링,교대최소제곱방법이있다.
12장,‘자연어처리’에서는단어바구니(BOW,BagofWords)의개념을설명한다.또한자연어데이터셋을효율적으로처리하는데필요한기술을소개한다.
13장,‘NLP에서토픽모델링및감정분석’에서는토픽모델링의개념을소개하고,가장중요한알고리즘인잠정적의미분석(latentsemanticanalysis)과잠재디리클레할당(latentDirichletallocation)을설명한다.후반부에서는감정분석문제에대해설명하고,이를해결하기위한접근방법을설명한다.

★옮긴이의말★

2016년우리는상당한충격을받았다.알파고라는인공지능(AI)기술이인간을이겼다는사실을접하게됐기때문이다.사실AI기술은지난수십년동안연구돼왔지만인간을능가하리라고는생각하지못했기때문일것이다.하지만2016년의딥마인드의알파고는이러한고정관념을깨버렸고AI연구에활기를가져왔다.이후에도우리는여러뉴스를통해현실에서AI를이용한성과가공개돼왔다는사실을매스컴을통해접해왔다.
물론기업현장에서도AI,머신러닝에대한관심이예전보다많이높아졌고,이를이용해혁신과새로운가치를만들기위해노력하고있다.기업뿐아니라학계에서도다양한연구와지원이이뤄지고있다.다만현재의AI는모든것을해결해주는만능이아니다.즉나름의장단점을갖고있다.예를들어AI가결정한내용에대해최종사용자가이해하는데어려움이있다보니현장에적용하는데어려운점이있다.하지만이러한한계에대한부분도‘설명가능한AI(AIeXplainableAI)’를통해해결하려고노력하고있다.이러한새로운기술에대한장단점을분석하고단점을개선하려는노력들덕분에AI가실생활에유용하게사용되는범위는넓어질것이라생각한다.이러한측면에서우리는머신러닝에사용되는여러가지유용한알고리즘에대한방법의이해와구현이필요하고,이를기반으로여러가지이슈사항을해결하는새로운기술개발또한필요할것이다.
이책은이러한필요성을느끼는사람들에게데이터전처리와머신러닝방법을소개하기위한것이다.특히파이썬을활용해머신러닝을구현해보려고하는사람에게많은도움이될것이라생각한다.각장별로해당주제에대한간략한설명과파이썬으로구현하는예제는현장에서업무를수행하는엔지니어가참고할만한내용을담고있다.부디이책이해당업무에서고군분투하고있는여러분들이업무를수행하는데일조할수있길바란다.