파이썬을 이용한 데이터 분석의 정석 (넘파이, 판다스, 맷플롯립과 실전 예제로 배우는)

파이썬을 이용한 데이터 분석의 정석 (넘파이, 판다스, 맷플롯립과 실전 예제로 배우는)

$33.78
Description
탄탄한 개념과 실전 예제를 한 권에 담았다!
데이터 분석을 다룬 많은 책 중 나에게 맞는 책을 찾는 건 매우 어렵다. 이론 위주의 책을 선택하면 이해하기 어렵고, 응용 위주의 책을 선택하면 기본 개념이 부족하다. 이 책은 이론을 쉽게 설명하고 예제로 응용해 보도록 구성하여 자연스럽게 데이터 분석 과정을 익힐 수 있다.

파이썬 데이터 분석에 필수로 사용되는 라이브러리를 단계적으로 다루어 데이터를 전처리하고 분석하는 능력을 갖춘다. 이 과정에서 넘파이, 판다스, 맷플롯립은 물론 연관 라이브러리까지 상세히 소개한다. 그리고 소개한 라이브러리를 종합하여 활용할 수 있는 세 가지 실전 예제를 담았다.
저자

채진석

출간작으로『파이썬을이용한데이터분석의정석』등이있다.

목차

01장개발환경구축
_1.1아나콘다설치
___환경변수설정
___파이썬가상환경설정
___conda와pip명령어
_1.2주피터노트북
__1.2.1주피터노트북의주요기능
___주피터노트북애플리케이션
__1.2.2주피터노트북설치
__1.2.3주피터노트북사용
__1.2.4노트북생성
__1.2.5노트북을이용한프로그래밍

02장파이썬빅데이터프로그래밍
_2.1파이썬과R
__2.1.1파이썬과R의특징및성능비교
__2.1.2파이썬과R의글로벌선호도
_2.2파이썬언어의기본개념
__2.2.1객체지향언어
__2.2.2파이썬빅데이터분석
___빅데이터분석을위한파이썬라이브러리
___넘파이와사이파이
___객체와클래스
___인스턴싱
___모듈
___함수와메소드
_2.3대화형컴퓨팅IPython
__2.3.1IPython의기능
__2.3.2IPyhon설치
___노트북
__2.3.3IPython의주요명령어
___도움및찾기명령어
___탭자동완성
___객체탐색
___셸커맨드
___매직함수
___실행및편집
___디버깅
__2.3.4IPythonQtConsole

03장넘파이
_3.1넘파이배열
__3.1.1넘파이모듈임포트
__3.1.2넘파이배열생성
___파이썬유사배열객체를넘파이배열로변환
___넘파이배열생성함수
___배열생성함수numpy.arange()
___디스크에서읽어서배열생성
__3.1.2넘파이ndarray클래스
___ndarray객체구조
__3.1.3넘파이배열의데이터타입
___numpy.dtype적용
_3.2구조화된배열
__3.2.1구조화된데이터타입
___구조화된데이터타입생성
___구조화된데이터타입조작및표시
___자동바이트오프셋및정렬
___필드제목
__3.2.2구조화된배열인덱싱및할당
___파이썬고유타입인튜플로할당
___스칼라값으로할당
___다른구조화된배열로할당
__3.2.2인덱싱과슬라이싱
___기본인덱싱구문
___배열객체요소선택
___기본인덱싱과슬라이싱
___고급인덱싱
___불리언배열로인덱싱
___슬라이싱과인덱스배열처리
___인덱스를반환하는numpy.nonzero(),numpy.transpose()함수
___다차원배열전치
__3.2.4유니버설함수
___classnumpy.ufunc
___유용한유니버설함수
_3.3배열객체관리와연산
__3.3.1뷰와복사
___뷰
___복사
__3.3.2브로드캐스팅
___브로드캐스팅규칙
___numpy.newaxis적용
___broadcast클래스
___브로드캐스팅연산
___수능성적분석예시
__3.3.3배열조작과정렬
___C우선배치와F우선배치
___배열을이어붙이고스택으로배치
___배열순서정렬
___히스토그램함수
__3.3.4배열연산
___다차원배열연산
___배열반복
___임의의수생성
___선형대수
_3.4넘파이적용
__3.4.1데이터파일입력과출력
___넘파이이진파일
___텍스트파일
___원시이진파일
___메모리맵파일
__3.4.2이미지처리
___넘파이와matplotlib활용
___사이파이모듈적용

04장판다스
_4.1판다스데이터구조
__4.1.1시리즈
___시리즈객체생성방법
___ndarray와의유사성
___딕셔너리와의유사성
___넘파이와의유사성
___시리즈이름설정과변경
__4.1.2데이터프레임
___딕셔너리에서데이터프레임객체생성
___ndarrays나리스트의딕셔너리에서데이터프레임객체생성
___구조화된배열또는레코드배열에서데이터프레임객체생성
___딕셔너리의리스트에서데이터프레임객체생성
___튜플의딕셔너리에서데이터프레임객체생성
___데이터프레임생성자
__4.1.3행과열의기본처리
___행또는열선택,추가,삭제
___인덱싱과선택
___pandas.DataFrame.loc와pandas.DataFrame.iloc
___데이터정렬및산술연산
___전치
___넘파이함수들과데이터프레임연동
__4.1.4인덱스관련객체
___pandas.Index클래스
___pandas.RangeIndex클래스
___Int64Index,Uint64Index,Float64Index클래스
___pandas.CategoricalIndex클래스
___pandas.Categorical클래스
___pandas.MultiIndex클래스
_4.2판다스의주요기능
__4.2.1판다스객체이진연산
__4.2.2요약과통계연산
__4.2.3함수적용
___테이블형태의함수적용
___행또는열단위의함수적용
__4.2.4AggregationAPI함수적용
___요소단위로함수들을적용
_4.3데이터처리
__4.3.1데이터선택
___라벨로데이터선택
___위치로데이터선택
___호출함수로데이터선택
__4.3.2데이터설정과검색
___데이터확장및변경
___불리언벡터로데이터필터링
___take()메소드로검색
__4.3.3손실데이터처리
___손실데이터계산
___손실데이터채우기
__4.3.4멀티인덱스
___멀티인덱스객체생성
___멀티인덱스인덱싱
___멀티인덱스순서정렬
_4.4데이터타입과입출력
__4.4.1텍스트파일
___CSV파일
___JSON파일
___HTML파일
___클립보드
__4.4.2이진데이터
___엑셀파일
___HDF5파일
__4.4.3SQL데이터베이스
___SQLAlchemy의엔진구성
___판다스SQL관련함수적용
___sqlite3
__4.4.4기상청대용량데이터세트의처리

05장판다스고급
_5.1데이터가공
__5.1.1데이터이어붙이기
___축의로직설정과append를사용하는이어붙이기
___차원이다른시리즈와데이터프레임이어붙이기
___그룹키로이어붙이기
__5.1.2데이터베이스타입의데이터프레임또는시리즈를합치기
___merge()함수로합치기
___join()메소드로합치기
___멀티인덱스객체합치기
___열과인덱스레벨을조합해합치기
___중복되는열처리하기
___시리즈나데이터프레임의열안에서값을합치기
__5.1.3데이터재형성하기
___데이터프레임객체피벗
___피벗테이블
___교차표
___더미변수계산
___stack()과unstack()메소드로재형성
___melt()메소드로재형성
__5.1.4파이썬정규표현식사용하기
___정규표현식구문
___re모듈
___정규표현식객체
___Match객체
__5.1.5텍스트데이터가공하기
___문자열을분할하고대체하기
___텍스트이어붙이기
___str로인덱스변경하기
___일기형식의텍스트데이터가공
_5.2데이터의그룹연산
__5.2.1데이터객체를그룹연산
___GroupBy객체속성
___GroupBy순서정렬
___멀티인덱스가있는객체를그룹연산
___그룹객체의반복처리
__5.2.2GroupBy객체를그룹별연산및변환
___데이터집계하기
___한번에여러함수적용하기
___데이터프레임열들에각각다른함수적용하기
___자동차판매대리점별영업현황데이터연산과변환
__5.2.3GroupBy객체를이용한분할,적용,통합
___학교별수학성적에분할,적용,통합연산실행
___apply()메소드적용
__5.2.4기타그룹연산
___불필요한부분을자동으로제거
___순서가정렬된요소를그룹화
___각그룹의행확인하기
_5.3수학계산
__5.3.1통계함수
___퍼센트변화율
___공분산
___상관관계
___데이터순위
__5.3.2윈도우함수
___시간인식이동
___이진윈도우함수
___쌍단위의공분산과상관관계를이동윈도우로계산하기
__5.3.3집계연산
___복수의함수를적용하기
___데이터프레임열들에여러함수를적용하기
__5.3.4기타윈도우적용
___확장윈도우
___지수가중윈도우

06장matplotlib
_6.1matplotlib기본
__6.1.1figure구성
___Axes,Axis,Artist
___matplotlib과pyplot
__6.1.2pyplot모듈
_6.2matplotlibAPI
__6.2.1그래프그리기
___그래프스타일꾸미기
___범주형변수로서브플롯생성
___Figure객체로서브플롯생성
__6.2.2라벨,범례,주석추가
___add_subplot()과add_axes()함수로그래프를그리고라벨붙이기
___스타일시트와rcParams로matplotlib실행하기
___matplotlib.pyplot.legend함수로범례설정하기
___범례위치정하기
___주석달기
__6.2.3텍스트추가
___텍스트생성명령어
___matplotlib.axis모듈
___눈금위치와형식정하기
___눈금과눈금라벨
__6.2.4기타그래프
___막대그래프
___원그래프
_6.3seaborn라이브러리
__6.3.1seaborn
___단변량데이터세트분포를시각화
___이변량데이터세트분포를시각화
___regplot으로회귀모델을시각화
___figure레벨과axes레벨의함수들
___산점도
___선그래프
__6.3.2범주형데이터시각화
___범주형산점도
___범주내에서관찰치분포
__6.3.3선형관계시각화
___선형회귀모델을시각화하는함수들
___다른변수들에조건부여
___그래프크기와모양수정
___컨텍스트에서회

출판사 서평

탄탄한개념과실전예제를한권에담았다!
〈br〉
-데이터분석의이론과응용을모두다룹니다.
데이터분석을다룬많은책중나에게맞는책을찾는건매우어렵습니다.이론위주의책을선택하면이해하기어렵고,응용위주의책을선택하면기본개념이부족합니다.이책은이론을쉽게설명하고예제로응용해보도록구성하여자연스럽게데이터분석과정을익힐수있습니다.
-필수라이브러리를상세히소개합니다.
바쁜독자들을위해여러책을뒤적이지않아도되도록기술하였습니다.라이브러리별로나누어장을구성하였고,속성과함수,기능을상세히수록하여필요한내용을사전처럼찾아쓸수있습니다.데이터분석의입문자에게는다양한사용법을습득할수있는지침서가,실무자에게는새로운응용을위한참고서가될것입니다.
-2,000여개의기초예제와3가지실전예제를실습합니다.
학습자가데이터분석을숙달할수있도록다양한예제를담았습니다.예제코드와결과를바로바로확인하여쉽고빠르게이해할수있습니다.또한범죄율,주식,축구경기결과데이터를담은실습파일을불러와분석해봄으로써고도의응용력을키우게됩니다.
〈br〉
이책은다음과같이구성되었습니다.
〈br〉
1장.개발환경구축〈br〉
앞으로실습에이용할도구를준비하는과정을소개합니다.아나콘다(Anaconda)와주피터노트북(JupyterNotebook)을설치하고주요기능을살펴봅니다.

2장.파이썬빅데이터프로그래밍〈br〉
파이썬이라는언어의특징을소개하고객체지향언어의원리를알아봅니다.또한주피터노트북과IPython프롬프트에서IPython의기능과주요명령어를살펴봅니다.

3장.넘파이〈br〉
데이터배열수식을빠르고수월하게처리할수있는넘파이에대해알아봅니다.넘파이배열의기본구조를설명하고넘파이배열과기능을다루는방법을학습합니다.

4장.판다스〈br〉
빅데이터분석과데이터전처리에가장많이사용하는판다스를학습합니다.판다스의데이터구조인시리즈와데이터프레임가공을연습하고다양한형태의데이터를입출력하는방법을알아봅니다.

5장.판다스고급〈br〉
판다스로불러온데이터를가공하고재형성하는기법을다룹니다.또한경제적코딩을위한정규표현식과데이터의그룹연산을설명하여데이터활용이라는궁극적목적에도달하도록합니다.

6장.맷플롯립〈br〉
pyplot,seaborn을이용하여다양한그래프를그리고설정해보며데이터의의미를손쉽게파악할수있도록시각화하는방법을학습합니다.

7장.시계열〈br〉
날짜및시간관련객체와시계열데이터를인덱싱하고가공하는방법을알아봅니다.
판다스를이용해시계열데이터를분석하는방법도설명합니다.
더불어다양한산업분야에서계획을세우고통찰하는방법을학습합니다.

8장.빅데이터분석〈br〉
1장부터7장까지학습한내용을종합해데이터분석을실습합니다.
실제데이터를불러와서분석하고결과를그래프로표현합니다.
이를바탕으로산업데이터를분석할능력을갖추고,데이터분석에대한고도의응용력을키웁니다.
〈br〉
이런분에게이책을추천합니다.
-실습위주의책을원하는데이터분석의입문자
-참고자료가필요한데이터분석실무자
-파이썬으로빅데이터나인공지능을다루고싶은학습자