파이썬 라이브러리를 활용한 데이터 분석 : 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

파이썬 라이브러리를 활용한 데이터 분석 : 영화 평점, 이름 통계, 선거 데이터 등 실사례 사용

$39.65
Description
데이터 분석을 배우는 가장 완벽한 방법
파이썬 라이브러리 사용법부터 실제 데이터를 활용한 실습까지
믿고 보는 파이썬 데이터 분석 대표 도서가 3판으로 돌아왔다. 파이썬 판다스 프로젝트 창시자인 웨스 맥키니가 직접 설명하는 파이썬 라이브러리 사용법은 실용적이고 현대적이다. 파이썬과 판다스 최신 버전을 기준으로 내용을 업데이트했고 다양한 사례를 살펴보며 데이터 분석 문제를 효과적으로 해결하는 방법을 알아본다.

판다스, 넘파이, IPython, 맷플롯립, 주피터 등 다양한 파이썬 라이브러리를 소개하고 새로운 기능뿐만 아니라 메모리 사용량을 줄이고 성능을 개선하는 고급 사용법까지 다룬다. 또한 모델링 도구인 statsmodels와 사이킷런 라이브러리도 소개한다. 신생아 이름 통계 자료, 대선 데이터베이스 등 실제 데이터로 실습하며 데이터에 적합한 도구를 선택하고 효과적으로 분석하는 전문가로 거듭나보자.

저자

웨스맥키니

저자:웨스맥키니(WesMcKinney)
뉴욕에서활동하는소프트웨어개발자이자기업가다.2007년MIT수학과학부과정을마치고코네티컷주그린위치에있는AQR캐피탈매니지먼트에서금융분석가로근무했다.복잡하고느린데이터분석툴에실망하여2008년파이썬을배우면서pandas프로젝트를시작했다.파이썬데이터커뮤니티의활발한일원이며데이터분석,금융,통계계산애플리케이션에서파이썬사용을독려하고있다.창업한DataPad가2014년클라우데라에인수된이후빅데이터기술에집중했으며아파치소프트웨어재단의프로젝트인아파치애로우와아파치파케이의ProjectManagementCommittee(프로젝트관리위원)로합류했다.2016년에는뉴욕에위치한투시그마투자사로옮겨오픈소스를활용해빠르고쉬운데이터분석환경을만드는데노력을기울이고있다.

역자:김영근
애플II에서BASIC으로프로그래밍을시작했고,장래희망을항상프로그래머라고말하고다니다정신차리고보니어느덧20년차중년(?)개발자가되었다.리눅스커뮤니티에서오랫동안활동했으며임베디드부터미들웨어,웹,스마트폰애플리케이션에이르기까지다양한분야에서개발했다.아시아인최초로파이썬소프트웨어재단이사로활동했으며2014년첫‘PyCon한국’을개최했다.한빛미디어에서『리눅스시스템프로그래밍(개정2판)』,『고성능파이썬』을번역했다.

목차

CHAPTER1시작하기전에
1.1다루는내용
1.2데이터분석에파이썬을사용하는이유
1.3필수파이썬라이브러리
1.4설치및설정
1.5커뮤니티와콘퍼런스
1.6이책을살펴보는방법

CHAPTER2파이썬기초,Ipython과주피터노트북
2.1파이썬인터프리터
2.2.IPython기초
2.3파이썬기초
2.4마치며

CHAPTER3내장자료구조,함수,파일
3.1자료구조와순차자료형
3.2함수
3.3파일과운영체제
3.4마치며

CHAPTER4넘파이기본:배열과벡터연산
4.1다차원배열객체ndarray
4.2난수생성
4.3유니버설함수:배열의각원소를빠르게처리하는함수
4.4배열을이용한배열기반프로그래밍
4.5배열데이터의파일입출력
4.6선형대수
4.7계단오르내리기예제
4.8마치며

CHAPTER5판다스시작하기
5.1판다스자료구조소개
5.2핵심기능
5.3기술통계계산과요약
5.4마치며

CHAPTER6데이터로딩과저장,파일형식
6.1텍스트파일에서데이터를읽고쓰는법
6.2이진데이터형식
6.3웹API와함께사용하기
6.4데이터베이스와함께사용하기
6.5마치며

CHAPTER7데이터정제및준비
7.1누락된데이터처리하기
7.2데이터변형
7.3확장데이터유형
7.4문자열다루기
7.5범주형데이터
7.6마치며

CHAPTER8데이터준비하기:조인,병합,변형
8.1계층적색인
8.2데이터합치기
8.3재구성과피벗
8.4마치며

CHAPTER9그래프와시각화
9.1맷플롯립API간략하게살펴보기
9.2판다스에서시본으로그래프그리기
9.3다른파이썬시각화도구
9.4마치며

CHAPTER10데이터집계와그룹연산
10.1그룹연산에대한고찰
10.2데이터집계
10.3apply메서드:일반적인분리-적용-병합
10.4그룹변환과래핑되지않은groupby
10.5피벗테이블과교차표
10.6마치며

CHAPTER11시계열
11.1날짜,시간자료형과도구
11.2시계열기초
11.3날짜범위,빈도,이동
11.4시간대다루기
11.5기간과기간연산
11.6리샘플링과빈도변환
11.7이동창함수
11.8마치며

CHAPTER12파이썬모델링라이브러리
12.1판다스와모델코드의인터페이스
12.2patsy로모델생성하기
12.3statsmodels소개
12.4사이킷런소개
12.5마치며

CHAPTER13데이터분석예제
13.1Bitly의1.USA.gov데이터
13.2무비렌즈의영화평점데이터
13.3신생아이름
13.4미국농무부영양소정보
13.52012년연방선거관리위원회데이터베이스
13.6마치며

APPENDIXA고급넘파이
A.1ndarray객체구조
A.2고급배열조작기법
A.3브로드캐스팅
A.4고급ufunc사용법
A.5구조화된배열과레코드배열
A.6정렬더알아보기
A.7넘바를이용해빠른넘파이함수작성하기
A.8고급배열입출력
A.9유용한성능팁

APPENDIXBIPython시스템더알아보기
B.1터미널키보드단축키
B.2매직명령어
B.3명령어히스토리사용하기
B.4운영체제와함께사용하기
B.5소프트웨어개발도구
B.6IPython을이용한생산적인코드개발팁
B.7IPython고급기능
B.8마치며

출판사 서평

판다스핵심개발자의데이터분석라이브러리사용설명서

2013년수정보완판으로출간되어2019년2판까지꾸준히국내독자에게사랑받아온[파이썬라이브러리를활용한데이터분석]이3판으로돌아왔다.지난10년동안파이썬은데이터과학,머신러닝,딥러닝에이르기까지수많은분야에서널리사용하는인기있는언어로굳건히자리잡았고,사용자를위해꾸준히업데이트되었다.3판은최신버전의파이썬,넘파이,판다스및기타프로젝트의변경사항에맞춰책내용을다듬었다.이책이대학에서는교재로,현업에서는참고도서로많이사용되는만큼이후몇년까지도유효한내용을담기위해심혈을기울였다.파이썬으로데이터를다뤄야하는모든이에게귀중한도서가되기를바란다.

3판에서달라진점

-파이썬3.11,판다스2.0기반으로코드업데이트
-넘파이1.23,주피터최신버전반영
-새로운내용추가
범주형데이터자료형
데이터그룹변환과래핑되지않은groupby
IPython의매직명령어와명령어히스토리사용법

이책은파이썬으로데이터를다루는다양하고기본적인방법을소개한다.파이썬프로그래밍언어기초와데이터분석문제를효율적으로해결하는데도움이되는라이브러리를다룬다.책의제목에‘데이터분석’이들어가있긴하지만데이터분석방법론보다는파이썬프로그래밍,라이브러리,도구에집중해설명한다.

대상독자

-데이터분석실무를맡게된데이터엔지니어,데이터과학자,머신러닝엔지니어,통계전문가
-파이썬대표라이브러리로데이터를분석해보고싶은IT관련학부생

주요내용

-넘파이기초와고급기능사용법
-판다스로데이터로딩,정제,조인,변형하기
-맷플롯립으로유용한시각화만들기
-판다스groupby기능으로데이터를나누고요약하기
-규칙적이거나불규칙적인시계열데이터분석및조작하기
-실제데이터를살펴보며분석문제해결법알아보기

옮긴이의말

인쇄기가세번째한국어판을막찍어내려던순간판다스2.0이릴리스되면서10년전초판을번역했을때기억이떠올랐다.판다스0.14버전으로쓰인책을번역하던도중계속새로운버전이나오면서많은부분을고치는과정이말도못할정도로힘들었는데,이번에는판다스2.0을설치하고예제코드를다시검토해저자에게PR을보내고,확인요청까지하는과정이다행히초판작업때만큼힘들지는않았다.:)

판다스도오랫동안함께사용할수있는안정적인라이브러리가되었고이책또한저자의바람대로오래두고볼수있게되었다.2판이도움이되었다면파이썬을활용해데이터를들여다보고자하는지인들에게망설임없이추천해도좋을책이다.