어쩌다 데이터 분석 with 파이썬 (판다스로 시작하는 효율적인 데이터 분석 및 시각화)

어쩌다 데이터 분석 with 파이썬 (판다스로 시작하는 효율적인 데이터 분석 및 시각화)

$28.07
Description
파이썬 데이터 분석은 처음EASY?
판다스 핵심 레시피와 예제로 익히는 파이썬 데이터 분석 기초!
이 책은 파이썬 데이터 분석을 위해 반드시 알아야 하는 판다스, 넘파이, 맷플롯립, 시본 등 파이썬 핵심 라이브러리를 사용해서 효과적으로 데이터를 분석하고 시각화하는 방법에 대해 다루고 있다. 파이썬 데이터 분석 입문자를 위해 일반적인 데이터 분석 과정으로 내용을 구성했으며 데이터 분석을 위한 중요한 핵심 함수와 처리 과정을 쉽고 간결하게 설명하고 있다. 마지막으로 넷플릭스 데이터셋으로 실무에 적용 가능한 데이터 전처리 및 시각화 과정을 실습해본다.
저자

김유지

ClaryK
블로그:blog.naver.com/youji4ever
동덕여대에서미디어디자인,국민대테크노디자인대학원에서인터랙션디자인을전공했다.UX컨설팅회사,외국계IT기업,IT스타트업등다양한환경에서일해온UX/UI기획자로적응력이빠르고새로운도전을좋아한다.몇년전자기계발및업무역량성장을위해파이썬프로그래밍과데이터분석스터디를시작했고정부R&D과제및금융서비스프로젝트에도참여했다.현업에데이터분석결과를다양한관점으로적용하기위해부단히노력중이다.온라인에서ClaryK라는필명으로활동하고있으며취미로블로그에파이썬지식과데이터시각화관련포스팅을하고있다.

목차

1장.데이터분석준비
1.1데이터분석의세계
1.2아나콘다설치및주피터노트북실행
1.3파이썬핵심정리
1.4파이썬데이터분석주요라이브러리
1.5데이터셋

2장.데이터분석기본
2.1넘파이기본
2.2판다스기본
2.3데이터로드와저장
2.4데이터확인
2.5데이터프레임의컬럼을다루는테크닉
2.6데이터인덱싱(데이터프레임의값선택)

3장.데이터정제와응용
3.1데이터필터링과정렬테크닉
3.2결측값처리
3.3이상값처리
3.4문자열데이터처리
3.5카테고리데이터처리
3.6람다를활용한데이터처리응용예제

4장.데이터병합과재형성
4.1데이터병합
4.2데이터재형성과피벗
4.3데이터병합후처리

5장.데이터집계와그룹연산
5.1그룹연산의이해
5.2피벗테이블과크로스탭활용

6장.날짜시간데이터처리
6.1날짜시간데이터타입
6.2날짜시간데이터인덱스
6.3Time/Date컴포넌트

7장.데이터시각화
7.1맷플롯립데이터시각화
7.2시본데이터시각화

8장.데이터분석:EDA실습
8.1데이터첫탐색
8.2데이터전처리
8.3데이터시각화기초
8.4데이터시각화고급
8.5실습을마치며

출판사 서평

개발환경준비+판다스핵심기능+데이터시각화+EDA실습

판다스는파이썬환경에서데이터를분석하기에최적화된오픈소스라이브러리이다.이책은파이썬데이터분석을위한준비과정과알아야하는개념그리고판다스핵심기능과데이터시각화기초까지다룬다.또한파이썬데이터분석에필요한핵심레시피를익힌뒤넷플릭스데이터셋으로실무도경험해본다.현업에적용할수있는EDA를실습하고데이터간유의미한상관관계를분석하며데이터분석역량을기를수있도록도와준다.

★이책의구성
STEP1데이터분석준비&기본
- 개발환경구축하기
- 파이썬기본내용
- 파이썬핵심라이브러리소개및기능설명

STEP2데이터정제와응용
- 데이터필터링/정렬테크닉
- 결측값/이상값확인및처리

STEP3데이터병합/그룹연산
- 데이터병합
- 테이블형식데이터재배치/피벗
- groupby를활용한그룹별요약및집계
- 피벗테이블과크로스탭활용

STEP4시계열데이터처리
- 날짜시간데이터타입
- 날짜시간데이터인덱스

STEP5데이터시각화
- 맷플롯립기본핵심
- 많이활용되는시본의주요그래프

STEP6실전연습
- EDA실습:넷플릭스데이터셋
- 데이터전처리기법적용및데이터시각화작업

1장_데이터분석준비
데이터분석이무엇이고어떻게진행되며어떤역량이필요한지살펴본다.그리고파이썬데이터분석을실행하기위한개발환경을구축한뒤이책을읽는데필요한파이썬기본내용과핵심라이브러리에대해알아본다.

2장_데이터분석기본
파이썬에서데이터분석을하기위해가장필수적으로알아야할라이브러리인넘파이
와판다스의기본사용법을학습한다.데이터를불러오고,생성하고,선택하고,골라내고,삭제하고새로운모양으로변경하는등기초적인데이터처리방법을배운다.

3장_데이터정제와응용
데이터를처리하고가공하는다양한방법을몇가지카테고리로분류해서배운다.먼저상세한조건으로데이터를추출하거나다른함수를활용하여데이터를필터링하는기법과정렬테크닉을알아본다.그다음결측값이생기는원인과판다스로결측값을확인하고처리하는방법에대해익힌뒤이상값을확인하고처리하는방법을살펴본다.

4장_데이터병합과재형성
서로다른데이터프레임을연결하고,합쳐진데이터프레임을다시다른모양으로변경하는학습을한다.판다스의함수를통해흩어져있는데이터를연결하고병합하는방법을익힌다.그리고테이블형식의데이터를다양한방식과기준으로데이터를재배치하거나피벗하는방법을학습한다.마지막으로데이터병합이나재형성후의처리방법에대해다룬다.

5장_데이터집계와그룹연산
판다스의groupby개념과활용법을배우고데이터를그룹별로나누어요약및집계를해본다.
또한판다스에서피벗테이블과그룹빈도를계산하는크로스탭을활용한분석에대해서알아본다.

6장_날짜시간데이터처리
판다스에서사용하는시계열데이터종류인datetime과관련하여날짜와시간에대한기초
지식을학습한다.날짜시간데이터를다룰때기초적으로알고있어야할데이터타입에대해배우고인덱스와관련있는몇가지주요처리방법에대해익힌다.

7장_데이터시각화
대표적인파이썬데이터시각화라이브러리인맷플롯립과시본을알아본다.먼저파이썬으로데이터시각화를할때필수적으로알아야할맷플롯립의핵심을학습한다.그다음많이활용되는시본의주요그래프에대해배워본다.

8장_데이터분석:EDA실습
앞에서배운기술을어떻게사용하고응용되는지익히기위해데이터분석실습과정을진행한다.분석하려는데이터의특징을파악하여적합한전처리기법을적용한후데이터를더잘이해할수있도록다양한시각화작업을해본다.

★대상독자
이책은파이썬을이용한데이터분석에대해관심있는입문자를대상으로한다.기본적으로파이썬기초를알고있다는전제하에설명하고있으나파이썬을접해보지못한독자를위해파이썬핵심기본내용을수록했다.

★예제소스
https://github.com/claryk0520/bumping-into-data-analysis