파이썬 데이터 사이언스 핸드북 - 위키북스 데이터 사이언스 시리즈 89 (개정판)

파이썬 데이터 사이언스 핸드북 - 위키북스 데이터 사이언스 시리즈 89 (개정판)

$39.29
Description
많은 연구원에게 파이썬은 데이터를 저장, 가공하고 데이터에서 통찰력을 얻을 수 있는 라이브러리 덕분에 데이터를 다루기에 최고의 도구로 여겨진다. 여러 참고 자료에서 파이썬 라이브러리를 소개하지만, 대부분은 각 라이브러리를 개별적으로 다룬다. 하지만 《파이썬 데이터 사이언스 핸드북》 개정판에서는 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn을 비롯한 관련 도구를 모두 다루며, 데이터 과학 및 머신러닝 활용에 꼭 필요한 도구를 성공적으로 설정하고 사용하는 데 도움이 되는 명확하고 따라 하기 쉬운 예제를 제공한다.

파이썬 코드를 읽고 작성하는 데 익숙한 과학자나 데이터 분석가라면 이 책이 데이터의 가공, 변환, 정제와 다른 유형의 데이터 시각화, 통계 모델이나 머신러닝 모델 구축을 위한 데이터 활용 면에서 흔히 발생하는 문제를 해결하기에 가장 이상적인 종합 참고서가 될 것이다. 간단히 말해, 이 책은 파이썬으로 데이터 사이언스 분야를 배우기 위해 반드시 소장해야 할 책이다.

이 핸드북을 통해 다음 도구의 사용법을 학습할 수 있다.

◎ IPython과 Jupyter: 파이썬을 이용하는 데이터 과학자를 위한 컴퓨팅 환경 제공
◎ NumPy: 파이썬의 복잡한 데이터 배열을 효율적으로 저장하고 가공할 수 있는 ndarray(n 차원 배열 객체) 제공
◎ Pandas: 파이썬에서 레이블이 붙거나 칼럼 형식의 데이터를 효율적으로 저장하고 가공하기 위한 DataFrame 자료구조 제공
◎ Matplotlib: 파이썬을 이용한 유연한 데이터 시각화 기능 제공
◎ Scikit-Learn: 기존 머신러닝 알고리즘 중 가장 중요한 것을 파이썬으로 효율적이고 깔끔하게 구현한 라이브러리
저자

제이크밴더플래스

저자:제이크밴더플래스(JakeVanderPlas)
파이썬과학스택의장기사용자이자개발자다.현재워싱턴대학교의학제간연구부장으로근무하면서독자적인천문학연구를수행하고있으며다양한분야의과학자와함께상담및컨설팅을진행하고있다.

역자:김정인
현재기업빅데이터전략팀에서근무하고있다.옮긴책으로는《실전!파이토치딥러닝프로젝트》《강화학습/심층강화학습특강》《실전!텐서플로2를활용한딥러닝컴퓨터비전》《케라스로구현하는고급딥러닝알고리즘》《실전!CoreML을활용한머신러닝iOS앱개발》《실전활용!텐서플로딥러닝프로젝트》《마이크로소프트봇프레임워크프로그래밍》《애자일데이터과학2.0》《구글애널리틱스완벽가이드》《파이썬데이터사이언스핸드북》《러닝스칼라》가있다.

목차

▣1장:Jupyter-파이썬에날개를달자
IPython과Jupyter시작하기
__IPython셸실행하기
__Jupyter노트북실행하기
__IPython의도움말과문서
__IPython셸에서사용할수있는키보드단축키
향상된대화형기능
__IPython매직명령어
__입력/출력이력
__IPython과셸명령어
디버깅및프로파일링
__에러와디버깅
__코드프로파일링및시간측정
__IPython추가참고자료

▣2장:NumPy소개
파이썬의데이터타입이해하기
__파이썬정수는정수이상이다
__파이썬리스트는리스트이상이다
__파이썬의고정타입배열
__파이썬리스트에서배열만들기
__처음부터배열만들기
__NumPy표준데이터타입
NumPy배열의기초
__NumPy배열속성지정
__배열인덱싱:단일요소에접근하기
__배열슬라이싱:하위배열에접근하기
__배열재구조화
__배열연결및분할
NumPy배열연산:유니버설함수
__루프는느리다
__Ufuncs소개
__NumPy유니버설함수(Ufuncs)
__고급Ufunc기능
__Ufuncs:더알아보기
집계:최솟값,최댓값,그리고그사이의모든것
__배열의값의합구하기
__최솟값과최댓값
__예제:미국대통령의평균신장은얼마일까?
배열연산:브로드캐스팅
__브로드캐스팅소개
__브로드캐스팅규칙
__실전브로드캐스팅
비교,마스크,부울로직
__예제:비온날세기
__ufunc으로서의비교연산자
__부울배열로작업하기
__마스크로서의부울배열
__키워드and/orvs.연산자&/|사용하기
팬시인덱싱
__팬시인덱싱알아보기
__결합인덱싱
__예제:임의의점선택하기
__팬시인덱싱으로값변경하기
__예제:데이터구간화
배열정렬
__NumPy의빠른정렬:np.sort와np.argsort
__행이나열기준으로정렬하기
__부분정렬:파티션나누기
__예제:k-최근접이웃알고리즘
구조화된데이터:NumPy의구조화된배열
__구조화된배열만들기
__고급복합타입
__레코드배열:트위스트를가진구조화된배열
__Pandas로넘어가며

▣3장:Pandas로데이터가공하기
Pandas객체소개
__PandasSeries객체
__PandasDataFrame객체
__PandasIndex객체
데이터인덱싱과선택
__Series에서데이터선택
__DataFrame에서데이터선택
Pandas에서데이터연산하기
__유니버설함수:인덱스보존
__유니버설함수:인덱스정렬
__유니버설함수:DataFrame과Series간의연산
누락된데이터처리하기
__누락된데이터처리방식의트레이드오프
__Pandas에서누락된데이터
__Pandas의널러블(Nullable)데이터타입
__널값연산하기
계층적인덱싱
__다중인덱스된Series
__MultiIndex생성메서드
__MultiIndex인덱싱및슬라이싱
__다중인덱스재정렬하기
데이터세트결합:Concat과Append
__복습:NumPy배열연결
__pd.concat을이용한간단한연결
데이터세트결합하기:병합과조인
__관계대수
__조인작업의분류
__병합키지정
__조인을위한집합연산지정하기
__열이름이겹치는경우:suffixes키워드
__예제:미국주데이터
집계와분류
__행성데이터
__Pandas의간단한집계연산
__GroupBy:분할,적용,결합
피벗테이블
__피벗테이블시작
__피벗테이블등장배경
__피벗테이블구문
__예제:출생률데이터
벡터화된문자열연산
__Pandas문자열연산소개
__Pandas문자열메서드목록
__예제:조리법데이터베이스
시계열다루기
__파이썬에서의날짜와시간
__Pandas시계열:시간으로인덱싱하기
__Pandas시계열데이터구조
__정규시퀀스:pd.date_range()
__주기와오프셋
__리샘플링,시프팅,윈도잉
__예제:시애틀자전거수시각화
고성능Pandas:eval()과query()
__query()와eval()의등장배경:복합표현식
__효율적인연산을위한pandas.eval()
__열단위의연산을위한DataFrame.eval()
__DataFrame.query()메서드
__성능:이함수를사용해야하는경우
__추가자료

▣04장:Matplotlib을활용한시각화
일반적인Matplotlib사용법
__matplotlib임포트하기
__스타일설정하기
__show()를사용할것인가,말것인가-플롯표현방법
간단한라인플롯
__플롯수정하기:선색상과스타일
__플롯조정하기:축경계
__플롯에레이블붙이기
__Matplotlib주의사항
간단한산점도
__plt.plot을사용한산점도
__plt.scatter를활용한산점도
__plot과scatter의차이:효율성측면에서유의할점
__오차시각화하기
밀도플롯과등고선플롯
__3차원함수시각화하기
__히스토그램,구간화,밀도
__2차원히스토그램과구간화
플롯범례맞춤변경하기
__범례에사용할요소선택하기
__점크기에대한범례
__다중범례
색상막대맞춤변경하기
__색상막대맞춤변경하기
__예제:손으로쓴숫자
다중서브플롯
__plt.axes:직접만든서브플롯
__plt.subplot:간단한서브플롯의그리드
__plt.subplots:한번에전체그리드만들기
__plt.GridSpec:복잡한배치
텍스트와주석
__예제:미국출생률에휴일이미치는영향
__변환및텍스트위치
__화살표와주석
눈금맞춤변경하기
__주눈금과보조눈금
__눈금또는레이블숨기기
__눈금개수줄이기와늘리기
__팬시눈금포맷
__위치지시자와서식지시자요약
Matplotlib맞춤변경하기:설정과스타일시트
__직접플롯변경하기
__기본값변경하기:rcParams
__스타일시트
Matplotlib에서3차원플로팅하기
__3차원점과선
__3차원등고선플롯
__와이어프레임과표면도
__표면삼각측량법
Seaborn을활용한시각화
__Seaborn플롯탐색하기
__예제:마라톤완주시간탐색
__추가자료
__기타파이썬그래픽라이브러리

▣5장:머신러닝
머신러닝이란무엇인가?
__머신러닝의범주
__머신러닝응용의정성적사례
__정리
Scikit-Learn소개
__Scikit-Learn에서의데이터표현방식
__EstimatorAPI
__응용:손으로쓴숫자탐색
__정리
초모수와모델검증
__모델검증에대한고려사항
__최적의모델선택하기
__학습곡선
__실제검증:그리드검색
__정리
특징공학
__범주특징
__텍스트특징
__이미지특징
__유도특징
__누락데이터의대체
__특징파이프라인
심화학습:나이브베이즈분류
__베이즈분류
__가우스나이브베이즈
__다항분포나이브베이즈
__언제나이브베이즈모델을사용할것인가
심화학습:선형회귀
__단순선형회귀
__기저함수회귀
__정규화
__예제:자전거통행량예측
심화학습:서포트벡터머신
__서포트벡터머신의동기
__서포트벡터머신:마진최대화
__예제:안면인식
__정리
심화학습:의사결정트리와랜덤포레스트
__랜덤포레스트등장배경:의사결정트리
__추정모델의앙상블:랜덤포레스트
__랜덤포레스트회귀
__예제:랜덤포레스트를사용한숫자분류
__정리
심화학습:주성분분석
__주성분분석소개
__PCA응용:노이즈필터링
__예제:고유얼굴
__정리
심화학습:다양체학습
__다양체학습:'HELLO'
__다차원척도법(MDS,MultidimensionalSacling)
__비선형다양체학습:국소선형임베딩
__다양체방식에대한몇가지생각
__예제:얼굴데이터에아이소맵적용
__예제:숫자데이터의구조시각화
심화학습:k-평균군집화
__k-평균소개
__기댓값-최대화
__예제
심화학습:가우스혼합모델
__GMM등장배경:k-평균의약점
__E-M단계일반화하기:가우스혼합모델
__공분산유형선택하기
__밀도추정에GMM사용하기
__예제:새로운데이터를생성하는GMM
심화학습:커널밀도추정
__KDE등장배경:히스토그램
__커널밀도추정의실제적용
__교차검증을통한대역폭선택
__예제:나이브하지않은베이즈(Not-So-NaveBayes)
응용:안면인식파이프라인
__HOG특징
__실제HOG:간단한안면인식기
__주의사항및개선사항
__머신러닝관련추가