실무로 통하는 ML 문제 해결 with 파이썬
저자

카일갤러틴,크리스알본

저자:카일갤러틴
데이터분석가,데이터과학자,머신러닝엔지니어로수년간경력을쌓은머신러닝인프라를위한소프트웨어엔지니어입니다.또한전문적인데이터과학멘토이자자원봉사컴퓨터과학교사입니다.소프트웨어엔지니어링과머신러닝이접목되는분야의글을종종발표합니다.현재카일은엣시(Etsy)의머신러닝플랫폼팀에서소프트웨어엔지니어로일하고있습니다.

저자:크리스알본
위키백과를호스팅하는비영리단체인위키미디어재단의머신러닝이사입니다

역자:박해선
기계공학을전공했지만졸업후엔줄곧코드를읽고쓰는일을했습니다.MicrosoftAIMVP,GCPChampionInnovator입니다.텐서플로우블로그(tensorflow.blog)를운영하고있고,머신러닝과딥러닝에관한책을집필하고번역하면서소프트웨어와과학의경계를흥미롭게탐험하고있습니다.『챗GPT로대화하는기술』(한빛미디어,2023),『혼자공부하는데이터분석with파이썬』(한빛미디어,2023),『혼자공부하는머신러닝+딥러닝』(한빛미디어,2020),『Doit!딥러닝입문』(이지스퍼블리싱,2019)을집필했습니다.『머신러닝교과서:파이토치편』(길벗,2023),『스티븐울프럼의챗GPT강의』(한빛미디어,2023),『핸즈온머신러닝3판』(한빛미디어,2023),『만들면서배우는생성딥러닝2판』(한빛미디어,2023),『코딩뇌를깨우는파이썬』(한빛미디어,2023),『트랜스포머를활용한자연어처리』(한빛미디어,2022),『케라스창시자에게배우는딥러닝2판』(길벗,2022),『개발자를위한머신러닝&딥러닝』(한빛미디어,2022),『XGBoost와사이킷런을활용한그레이디언트부스팅』(한빛미디어,2022),『구글브레인팀에게배우는딥러닝withTensorFlow.js』(길벗,2022),『(개정2판)파이썬라이브러리를활용한머신러닝』(한빛미디어,2022),『머신러닝파워드애플리케이션』(한빛미디어,2021),『파이토치로배우는자연어처리』(한빛미디어,2021),『머신러닝교과서3판』(길벗,2021)을포함하여여러권의책을우리말로옮겼습니다.

목차

1장벡터,행렬,배열
_1.0소개
_1.1벡터만들기
_1.2행렬만들기
_1.3희소행렬만들기
_1.4넘파이배열사전할당하기
_1.5원소선택하기
_1.6행렬정보확인하기
_1.7벡터화연산적용하기
_1.8최댓값,최솟값찾기
_1.9평균,분산,표준편차계산하기
_1.10배열크기바꾸기
_1.11벡터나행렬전치하기
_1.12행렬펼치기
_1.13행렬의랭크구하기
_1.14행렬의대각원소추출하기
_1.15행렬의대각합계산하기
_1.16점곱계산하기
_1.17행렬덧셈과뺄셈
_1.18행렬곱셈
_1.19역행렬
_1.20난수생성하기

2장데이터적재
_2.0소개
_2.1샘플데이터셋적재하기
_2.2모의데이터셋만들기
_2.3CSV파일적재하기
_2.4엑셀파일적재하기
_2.5JSON파일적재하기
_2.6파케이파일적재하기
_2.7아브로파일적재하기
_2.8SQLite데이터베이스로부터적재하기
_2.9원격SQL데이터베이스에쿼리하기
_2.10구글시트에서데이터적재하기
_2.11S3버킷에서데이터적재하기
_2.12비구조적인데이터적재하기

3장데이터랭글링
_3.0소개
_3.1데이터프레임만들기
_3.2데이터에대한정보확인하기
_3.3데이터프레임슬라이싱하기
_3.4조건에따라행선택하기
_3.5값정렬하기
_3.6값치환하기
_3.7열이름바꾸기
_3.8최솟값,최댓값,합,평균계산및개수세기
_3.9고유한값찾기
_3.10누락된값다루기
_3.11열삭제하기
_3.12행삭제하기
_3.13중복된행삭제하기
_3.14값에따라행을그룹핑하기
_3.15시간에따라행을그룹핑하기
_3.16연산집계와통계
_3.17열원소순회하기
_3.18모든열원소에함수적용하기
_3.19그룹에함수적용하기
_3.20데이터프레임연결하기
_3.21데이터프레임병합하기

4장수치형데이터다루기
_4.0소개
_4.1특성스케일바꾸기
_4.2특성표준화하기
_4.3정규화하기
_4.4다항특성과교차항특성생성하기
_4.5특성변환하기
_4.6이상치감지하기
_4.7이상치다루기
_4.8특성이산화하기
_4.9군집으로샘플을그룹으로묶기
_4.10누락된값을가진샘플삭제하기
_4.11누락된값채우기

5장범주형데이터다루기
_5.0소개
_5.1순서가없는범주형특성인코딩하기
_5.2순서가있는범주형특성인코딩하기
_5.3특성딕셔너리인코딩하기
_5.4누락된클래스값대체하기
_5.5불균형한클래스다루기

6장텍스트다루기
_6.0소개
_6.1텍스트정제하기
_6.2HTML파싱과정제하기
_6.3구두점삭제하기
_6.4텍스트토큰화하기
_6.5불용어삭제하기
_6.6어간추출하기
_6.7품사태깅하기
_6.8개체명인식수행하기
_6.9텍스트를BoW로인코딩하기
_6.10단어중요도에가중치부여하기
_6.11텍스트벡터를사용해검색쿼리텍스트의유사도계산하기
_6.12감성분석분류기사용하기

7장날짜와시간다루기
_7.0소개
_7.1문자열을날짜로변환하기
_7.2시간대다루기
_7.3날짜와시간선택하기
_7.4날짜데이터를여러특성으로나누기
_7.5날짜간의차이계산하기
_7.6요일인코딩하기
_7.7시차특성만들기
_7.8이동시간윈도사용하기
_7.9시계열데이터에서누락된값다루기

8장이미지다루기
_8.0소개
_8.1이미지로드하기
_8.2이미지저장하기
_8.3이미지크기변경하기
_8.4이미지자르기
_8.5이미지흐리게하기
_8.6이미지선명하게하기
_8.7대비높이기
_8.8색깔구분하기
_8.9이미지이진화하기
_8.10배경제거하기
_8.11윤곽선감지하기
_8.12모서리감지하기
_8.13머신러닝특성만들기
_8.14컬러히스토그램을특성으로인코딩하기
_8.15사전훈련된임베딩을특성으로사용하기
_8.16OpenCV로객체탐지하기
_8.17파이토치로이미지분류하기

9장특성추출을사용한차원축소
_9.0소개
_9.1주성분을사용해특성줄이기
_9.2선형적으로구분되지않은데이터의차원축소하기
_9.3클래스분리를최대화하여특성줄이기
_9.4행렬분해를사용하여특성줄이기
_9.5희소한데이터의특성줄이기

10장특성선택을사용한차원축소
_10.0소개
_10.1분산을기준으로수치특성선택하기
_10.2분산을기준으로이진특성선택하기
_10.3상관관계가큰특성다루기
_10.4분류작업에관련없는특성삭제하기
_10.5재귀적특성제거하기

11장모델평가
_11.0소개
_11.1교차검증모델만들기
_11.2기본회귀모델만들기
_11.3기본분류모델만들기
_11.4이진분류기의예측평가하기
_11.5이진분류기임곗값평가하기
_11.6다중클래스분류기예측평가하기
_11.7분류기성능시각화하기
_11.8회귀모델평가하기
_11.9군집모델평가하기
_11.10사용자정의평가지표만들기
_11.11훈련세트크기에따른영향시각화하기
_11.12평가지표리포트만들기
_11.13하이퍼파라미터값의영향시각화하기

12장모델선택
_12.0소개
_12.1완전탐색을사용해최선의모델선택하기
_12.2랜덤탐색을사용해최선의모델선택하기
_12.3여러학습알고리즘에서최선의모델선택하기
_12.4전처리와함께최선의모델선택하기
_12.5병렬화로모델선택속도높이기
_12.6알고리즘에특화된기법을사용해모델선택수행속도높이기
_12.7모델선택후성능평가하기

13장선형회귀
_13.0소개
_13.1직선학습하기
_13.2교차특성다루기
_13.3비선형관계학습하기
_13.4규제로분산줄이기
_13.5라소회귀로특성줄이기

14장트리와랜덤포레스트
_14.0소개
_14.1결정트리분류기훈련하기
_14.2결정트리회귀훈련하기
_14.3결정트리모델시각화하기
_14.4랜덤포레스트분류기훈련하기
_14.5랜덤포레스트회귀훈련하기
_14.6OOB데이터로랜덤포레스트평가하기
_14.7랜덤포레스트에서중요한특성구분하기
_14.8랜덤포레스트에서중요한특성선택하기
_14.9불균형한클래스다루기
_14.10트리크기제어하기
_14.11부스팅을사용해성능향상하기
_14.12XGBoost모델훈련하기
_14.13LightGBM으로실시간성능향상하기

15장k-최근접이웃
_15.0소개
_15.1샘플의최근접이웃찾기
_15.2k-최근접이웃분류기만들기
_15.3최선의이웃개수결정하기
_15.4반지름기반의최근접이웃분류기만들기
_15.5근사최근접이웃찾기
_15.6근사최근접이웃평가하기

16장로지스틱회귀
_16.0소개
_16.1이진분류기훈련하기
_16.2다중클래스분류기훈련하기
_16.3규제로분산줄이기
_16.4대용량데이터에서분류기훈련하기
_16.5불균형한클래스다루기

17장서포트벡터머신
_17.0소개
_17.1선형분류기훈련하기
_17.2커널을사용해선형적으로구분되지않는클래스다루기
_17.3예측확률계산하기
_17.4서포트벡터식별하기
_17.5불균형한클래스다루기

18장나이브베이즈
_18.0소개
_18.1연속적인특성으로분류기훈련하기
_18.2이산적인카운트특성으로분류기훈련하기
_18.3이진특성으로나이브베이즈분류기훈련하기
_18.4예측확률보정하기

19장군집
_19.0소개
_19.1k-평균을사용한군집
_19.2k-평균군집속도향상하기
_19.3평균이동을사용한군집
_19.4DBSCAN을사용한군집
_19.5계층적병합을사용한군집

20장파이토치텐서
_20.0소개
_20.1텐서만들기
_20.2넘파이로텐서만들기
_20.3희소텐서만들기
_20.4텐서원소선택하기
_20.5텐서구조파악하기
_20.6원소에연산적용하기
_20.7최댓값과최솟값찾기
_20.8텐서크기바꾸기
_20.9텐서전치하기
_20.10텐서펼치기
_20.11점곱계산하기
_20.12텐서곱셈

21장신경망
_21.0소개
_21.1파이토치자동미분사용하기
_21.2신경망을위해데이터전처리하기
_21.3신경망구성하기
_21.4이진분류기훈련하기
_21.5다중분류기훈련하기
_21.6회귀모델훈련하기
_21.7예측하기
_21.8훈련기록시각화하기
_21.9가중치규제로과대적합줄이기
_21.10조기종료로과대적합줄이기
_21.11드롭아웃으로과대적합줄이기
_21.12모델훈련진행과정저장하기
_21.13신경망튜닝하기
_21.14신경망시각화하기

22장비정형데이터를위한신경망
_22.0소개
_22.1이미지분류신경망훈련하기
_22.2텍스트분류신경망훈련하기
_22.3이미지분류를위해사전훈련된모델미세튜닝하기
_22.4텍스트분류를위해사전훈련된모델미세튜닝하기

23장훈련모델의저장,로딩,서빙
_23.0소개
_23.1사이킷런모델저장하고로드하기
_23.2텐서플로모델저장하고로드하기
_23.3파이토치모델저장하고로드하기
_23.4사이킷런모델서빙하기
_23.5텐서플로모델서빙하기
_23.6셀던으로파이토치모델서빙하기

찾아보기

출판사 서평

주요내용
*벡터,행렬,배열
*CSV,JSON,SQL,데이터베이스,클라우드스토리지및기타소스데이터로작업하기
*수치형과범주형데이터,텍스트,이미지,날짜,시간다루기
*특성추출또는특성선택을사용한차원축소
*모델평가와선택
*선형회귀,로지스틱회귀,트리,랜덤포레스트,k-최근접이웃
*서포트벡터머신(SVM),나이브베이즈,군집,트리기반모델지원
*훈련된모델의저장,로드및서빙

전처리부터딥러닝까지,216개실용예제로익히는문제해결기법

2018년에출간된1판『파이썬을활용한머신러닝쿡북』은늘어나는머신러닝콘텐츠사이에서중요한간극을채웠습니다.실용적이고잘테스트된파이썬레시피를제공하여실무자들이코드를복사하여붙여넣은후쉽게자신의문제에맞게조정할수있었습니다.지난5년동안머신러닝분야는딥러닝과이와관련된파이썬프레임워크의발전과함께계속크게성장해왔습니다.그리고이제는머신러닝과딥러닝실무자들의요구를충족시킬수있는최신파이썬라이브러리를활용한실용적인콘텐츠가필요하게되었습니다.이책은1판의저자가해낸기존의훌륭한작업을기반으로다음과같은내용을추가했습니다.

*예제를최신파이썬버전과프레임워크로업데이트합니다.
*데이터소스,데이터분석,머신러닝및딥러닝분야의최신방법을반영합니다.
*딥러닝콘텐츠를확장하여텐서와신경망을추가하고,파이토치로텍스트및비전을위한모
*델을만듭니다.
*한걸음더나아가모델을서빙하여API로제공합니다.

쿡북스타일의이책은하나의레시피가특정메서드나클래스의사용방법을다룹니다.하지만레시피가비교적짧다보니,다양한옵션이나유사함수들을충분히설명하지는못합니다.원서의이런미진한부분을보완하고자박해선역자는대부분의레시피에‘덧붙임’이라는항목을새롭게만들고내용을추가했습니다(모든레시피에다들어가지는않습니다).역자가세심하게추가보완한내용을통해독자여러분이더욱풍부하고유용한정보를얻기를바랍니다.