으뜸 데이터 분석과 머신러닝 (개정판)

으뜸 데이터 분석과 머신러닝 (개정판)

$35.06
Description
데이터 분석을 처음 시도하는 독자들을 위하여 아나콘다라는 주요 개발 도구의 설치와 주피터 노트북의 세부 메뉴를 하나하나 소개하며 시작한다. 또한 데이터 분석을 위하여 널리 사용되는 넘파이와 판다스, 맷플롯립 등의 인기 있는 도구를 쉽게 이해할 수 있도록 간결한 예제 코드와 그 결과를 보여주고 있다.
저자

박동규

1993年부산대학교전자계산학과이학사,1996年부산대학교전자계산학과이학석사,1999年부산대학교전자계산학과이학박사,2002年~현재창원대학교정보통신공학과교수,2021年부산대학교컴퓨터및정보통신연구소객원교수,2007年미국카네기멜론대학교(CMU)방문교수,2012年미국텍사스A&M대학교방문교수,창원대학교정보전산원장,창원시스마트모바일앱센터장역임,"널널한교수의코딩클래스"유튜브채널운영중dlek.

github:https://github.com/dongupak

목차

Chapter01빅데이터와데이터분석의중요성
1.1빅데이터와데이터분석
1.2점점더중요해지고있는데이터의가치
1.3데이터에서콜레라퇴치의길을찾다
1.4디지털데이터를알아보자
1.5디지털데이터와디지털전환
1.6디지털데이터의표현방법
1.7인류최대의도전-블랙홀관측과데이터분석
1.8새로운과학의패러다임을알아보자
1.9이책에서배울데이터분석을위한도구
연습문제

Chapter02데이터분석을위한개발도구
2.1데이터분석과머신러닝을위한강력한프로그래밍언어:파이썬
2.2모듈의개념과활용
2.3모듈의활용과패키지설치하기
2.4파이썬의강력한패키지들
2.5아나콘다개발도구를설치하고사용해보자
2.6주피터노트북의여러가지기능들
2.7주피터노트북의셀과코드입력
2.8주피터노트북의작동방식
2.9IPython을사용해보자
2.10IPython에서제공하는매직명령어
2.11데이터과학자들의의사소통을도와주는마크다운
2.12알아두면편리한고급마크다운기능과명령모드
2.13클라우드환경의개발은코랩으로편리하게
2.14코랩은구글리눅스가상머신에서동작한다
2.15코랩디스크마운트하고파일올리기
2.16코랩디스크의내용확인하기
연습문제
심화문제

Chapter03파이썬최고의라이브러리:넘파이
3.1파이썬리스트와넘파이
3.2파이썬리스트vs넘파이다차원배열
3.3다차원배열의속성들
3.4다차원배열과브로드캐스팅
3.5연속적인값을가지는다차원배열의생성
3.6다차원배열의축과삽입
3.7넘파이배열의인덱싱과슬라이싱
3.8넘파이스타일의슬라이싱과논리인덱싱
3.9다차원배열의최대값,최소값,평균값구하기와정렬
3.10다차원배열을위한append()함수와행렬곱셈
3.11과학자들이사랑하는수:난수
3.12다양한난수만들기함수를살펴보자
3.13평균,분산,표준편차를알아보자
심화:넘파이는왜성공했나
3.14벡터화연산의성능을측정해보자
3.15리덕션:배열을더강력하게만드는기능
3.16배열의결합concatenate,vstack,hstack
3.17배열을결합하는r_,c_클래스와column_stack()함수
연습문제
심화문제

Chapter04데이터시각화도구맷플롯립
4.1데이터과학과효과적인시각화의필요성
4.2데이터과학을위한시각화도구matplotlib
4.3plot()함수의선그리기기능들을알아보자
4.4복잡한선을그리고이미지로저장하자
4.5제목과레이블,스타일에대해알아보자
4.6Figure,axes에대하여살펴보자
4.7subplot()의고급기능
4.8자료값의분포를나타내는산점도와막대그래프
4.9파이차트와히트맵표현
4.10히스토그램그리기
4.11히스토그램을이용한정규분포함수와확률밀도함수그리기
4.12정규분포함수와확률밀도함수
4.13상자수염그리기
4.14그래프의크기와그리드그리기
연습문제
심화문제

Chapter05통계데이터와시본라이브러리
5.1데이터사이의관련성을알아보자
5.2데이터사이의상관관계와인과관계
5.3상관계수를구하고시각화를하도록하자
5.4특성간의관련성을알려주는상관계수와쌍그래프
5.5시본라이브러리시작하기
5.6tips데이터와여러가지시각화방법
5.7산점도그래프로관계를상세하게나타내보자
5.8변수사이의관계를알아보기에편리한쌍그래프
5.9Anscombe’squartet데이터셋을알아보자
5.10비선형함수를사용하여데이터를설명하자
5.11시본의또다른데이터셋:flights데이터셋
연습문제
심화문제

Chapter06엑셀보다판다스
6.1엑셀보다빠르고강력한판다스
6.2시리즈와자료형과결손값
6.3판다스의기본구조인시리즈와데이터프레임
6.4csv데이터를읽고확인하기
6.5데이터프레임의구조
6.6새로운열을생성하자
6.7inplace로데이터프레임갱신하기
6.8데이터프레임시각화
6.9편리하고강력한시각화
6.10편리한데이터다루기-슬라이싱과인덱싱
6.11loc,iloc인덱서
6.12판다스를이용한기상데이터분석
6.13데이터정제와결손값의처리
6.14시계열자료분석을위한DatetimeIndex
6.15특정한값에기반하여데이터를묶어보자:그룹핑
6.16그룹핑과필터링
6.17데이터구조를변경하는pivot()
6.18두개의데이터프레임을하나로합치는concat()
6.19테이블데이터의결합:concat()과merge()
연습문제
심화문제

Chapter07머신러닝기초:사이킷런과선형회귀
7.1경험을통해서학습하는인간을통해지능을정의해보자
7.2머신러닝의정의와종류를알아보자
7.3회귀분석과독립변수,종속변수
7.4사이킷런을이용한선형회귀
7.5선형회귀모델의계수와절편
7.6간단한선형회귀를수행해보자
7.7데이터를시각화하고차원을증가시키자
7.8회귀모델의오차함수와결정계수
7.9오차함수의구현과파라미터공간의최적값
7.10미분과경사하강법
7.11경사하강법과학습의원리
7.12경사하강법과학습률
LAB7-1머신러닝최적화에숨어있는수학적원리를알아보자
연습문제
심화문제

Chapter08다중회귀와규제
8.1변수가여러개인공간에서의회귀분석
8.2캐글데이터를이용해서분석해보자
8.3기대수명데이터둘러보기
8.4기대수명과상관관계가높은데이터는무엇인가
8.5쌍그래프로특성분석하기
8.6훈련데이터,테스트데이터그리고특성
LAB8-1상관도를시각화하여중요특성을분석하자
8.7데이터의분포가직선이아니라면?다항회귀모델을사용하자
8.8다항회귀모델을사용하자
LAB8-23차방정식을만들고다항회귀모델을이용하여예측하기
8.9과대적합에주의하자
8.10과소적합,과대적합,그리고규제
8.11최적화와규제항을적용한릿지회귀
8.12릿지회귀와alpha값
연습문제
심화문제

Chapter09분류와군집나누기
9.1분류와군집화를알아보자
9.2로지스틱회귀모델과시그모이드함수
9.3시그모이드함수와지수의관계
9.4결정경계와교차엔트로피
9.5로지스틱회귀모델을위한데이터만들기
9.6로지스틱회귀모델구현하기
9.7가까운이웃으로분류하는k-NN분류기
9.8k-NN활용예제-붓꽃데이터준비하기
9.9k-NN활용예제-붓꽃데이터로학습하기
9.10새로운꽃에대해서모델을적용하고분류해보자
9.11게임을하는고객의군집을만들어보자
9.12데이터전처리의필요성
9.13데이터정규화방법을이용하자
9.14다양한스케일러살펴보기
9.15스케일러사용시의주의사항
9.16스케일러사용실전사례:유방암데이터셋
9.17붓꽃데이터집합을k-평균군집화기법으로분류하자
9.18붓꽃데이터집합의군집중심을알아보자
심화:Logit의개념과선형로지스틱회귀
연습문제
심화문제

Chapter10다양한머신러닝기법-SVM,결정트리,차원축소
10.1서포트벡터머신의소개
10.2서포트벡터머신의구현방법
10.3분류오류와마진오류최소화사이의트레이드오프
10.4서포트벡터머신을파이프라인을사용하여구현해보기
10.5많은데이터에대하여서포트벡터머신으로분류하기
10.6커널함수를이용한서포트벡터머신
10.7여러서포트벡터머신분류결과를시각화하자
10.8결정트리와분류
10.9엔트로피를계산해보자
10.10엔트로피곡면과정보이득
10.11불순도를이용한의사결정트리-CART알고리즘
10.12결정트리구현해보기
10.13앙상블기법
10.14앙상블모델의성능비교
10.15차원의저주
10.16차원축소
10.173차원공간의데이터에서주성분찾기
10.184차원공간에존재하는붓꽃데이터를2차원에서분류해보자
연습문제
심화문제

Chapter11하이퍼파라미터튜닝과성능평가-교차검증,성능평가,가상데이터
11.1좋은모델선택을위한노력:K-겹교차검증
11.2교차검증의구현
11.3교차검증의결과를살펴보자
11.4모델의성능평가방법과데이터편향의문제
11.5데이터편향문제를극복하자:데이터증강
11.6분류모델의성능평가지표들
11.7모델의성능평가방법에대한직관적이해
11.8모델의성능평가방법들
11.9합성데이터셋을만들자:make_blob()함수
11.10군집데이터셋시각화
11.11고급군집화기능
11.12가장좋은군집의수는어떻게찾을수있을까
연습문제
심화문제

Chapter12신경망과퍼셉트론
12.1인간뇌의비밀
12.2단순한퍼셉트론의구조를살펴보자
12.3신경망을만들기위한간단한행렬표현법
12.4AND와OR회로를퍼셉트론으로만들자
12.5퍼셉트론을학습시키자
12.6퍼셉트론을학습시키는알고리즘을구현하자
12.7인공지능의겨울:퍼셉트론의한계와XOR문제
12.8다층퍼셉트론으로XOR연산을하자
12.9오차역전파를개략적으로살펴보자
12.10왜여러가지활성화함수가필요할까
12.11다층퍼셉트론의학습원리
연습문제
심화문제

Chapter13텐서플로로따라하는딥러닝
13.1가장인기있는머신러닝,딥러닝플랫폼:텐서플로
13.2텐서플로알아보기
13.3MNIST데이터가져오기
13.4MNIST데이터그리기
13.5심층신경망모델을만들고하이퍼파라미터를튜닝하자
13.6인공신경망을학습시켜보자
13.7인공신경망의성능을개선해보자
13.8새이미지를잘학습하는가알아보자
13.9부드러운최대값을출력하는소프트맥스함수
13.10직접만든이미지를업로드하고테스트하자
13.11이미지데이터의전처리기법
13.12붓꽃데이터의분류에도전하자
13.13분류정확도를높이기위한층을추가하자
13.14학습한모델을저장하고불러오자
13.15수치값을예측하는딥러닝모델
연습문제
심화문제