파이썬 머신러닝 판다스 데이터 분석

파이썬 머신러닝 판다스 데이터 분석

$30.00
Description
데이터 과학자가 되기 위한 첫걸음!

어려운 이론은 최소화하고, 예제 코드를 따라 하며 자연스럽게 사용법에 익숙해지도록 안내하는 데이터 분석 입문서다. 데이터 분석을 처음 배우는 입문자의 입장에서 고급 이론과 데이터 분석 도구를 함께 배우는 것의 어려움을 아는 저자가, 데이터 분석에 필요한 필수 라이브러리를 소개하고 설치부터 예제 코드까지 따라 할 수 있게 구성했다. 개념 이해를 돕기 위해 다이어그램 등 풍부한 도식화도 적극 활용했다. 1판에서 큰 인기를 얻어 준비된 이번 개정판에서는 저자가 실무에서 쌓은 경험을 자연스럽게 녹이기 위해 노력했다. 여러 기업과 대학에서 계속 강의를 해오고 있는 만큼 더욱 자세한 설명과 다양한 데이터 시각화, 데이터 전처리 기법을 담았으며, Pandas 2.0 버전에서 추가되거나 변경된 내용을 풍부하게 담아 데이터 분석에 필요한 최신 기술과 기능을 습득할 수 있다. 또한 저자 블로그나 깃헙, 그리고 유튜브에서 질의응답 게시판을 운영하고 있어, 궁금한 점이나 책과 관련된 요청 사항을 전달할 수 있다.

저자

오승환

저자:오승환
과학고,서울대를졸업하고,중국CKGSBMBA,FRM(미국재무위험관리사)자격을보유하고있다.국내주요금융기관과대기업에서기업분석및전략기획업무를담당했다.IT비전공자이지만데이터분석과인공지능을독학으로익혔고,현재핀테크스타트업대표이자인공지능강사로활발하게활동하고있다.유튜브<판다스스튜디오>를운영하며,저서로는『파이썬딥러닝텐서플로』등이있다.

목차


PART1.판다스입문
1.데이터과학자가판다스를배우는이유
2.판다스자료구조
2-1.시리즈
2-2.데이터프레임
3.인덱스활용
4.산술연산
4-1.시리즈연산
4-2.데이터프레임연산
5.필터링
5-1.불린인덱싱
5-2.query()메소드활용
5-3.isin()메소드활용
6.텍스트처리
6-1.텍스트저장
6-2.문자열메소드(stringmethods)

PART2.데이터입출력
1.외부파일읽어오기
1-1.CSV파일
1-2.Excel파일
1-3.JSON파일
2.웹(web)에서가져오기
2-1.HTML웹페이지에서표속성가져오기
2-2.웹스크래핑
3.API활용하여데이터수집하기(1)
4.API활용하여데이터수집하기(2)
5.데이터저장하기
5-1.CSV파일로저장
5-2.JSON파일로저장
5-3.Excel파일로저장
5-4.여러개의데이터프레임을하나의Excel파일로저장

PART3.데이터살펴보기
1.데이터프레임의구조
1-1.데이터내용미리보기
1-2.데이터요약정보확인하기
1-3.데이터개수확인

2.통계함수적용
2-1.평균값
2-2.중앙값
2-3.최댓값
2-4.최솟값
2-5.표준편차
2-6.상관계수
3.판다스내장그래프도구활용

PART4.시각화도구
1.Matplotlib-기본그래프도구
1-1.선그래프
1-2.면적그래프
1-3.막대그래프
1-4.히스토그램
1-5.산점도
1-6.파이차트
1-7.박스플롯
2.Seaborn라이브러리-고급그래프도구
3.Folium라이브러리-지도활용

PART5.데이터사전처리
1.누락데이터처리
2.중복데이터처리
3.데이터정규화
3-1.단위환산
3-2.자료형변환
4.범주형(카테고리)데이터처리
4-1.구간분할
4-2.더미변수
5.피처스케일링
6.시계열데이터
6-1.다른자료형을시계열객체로변환
6-2.시계열데이터만들기
6-3.시계열데이터활용
6-4.시계열데이터시각화

PART6.데이터프레임의다양한응용
1.함수매핑
1-1.개별원소에함수매핑
1-2.시리즈객체에함수매핑
1-3.데이터프레임객체에함수매핑
2.열재구성
2-1.열순서변경
2-2.열분리
3.그룹연산
3-1.그룹객체만들기(분할단계)
3-2.그룹연산메소드(적용-결합단계)
4.멀티인덱스
5.데이터프레임합치기
5-1.데이터프레임연결
5-2.데이터프레임병합
5-3.데이터프레임조인
6.피벗테이블
7.스택(stack)
8.멜트(melt)

PART7.머신러닝데이터분석
1.머신러닝개요
1-1.머신러닝이란?
1-2.지도학습vs비지도학습
1-3.머신러닝프로세스
2.회귀분석
2-1.단순회귀분석
2-2.다항회귀분석
2-3.다중회귀분석
3.분류
3-1.KNN
3-2.SVM
3-3.DecisionTree
4.군집
4-1.k-Means
4-2.DBSCAN

출판사 서평

예제중심으로실무용데이터분석을바로배우자!

복잡한이론이아닌,풍부한예제로비전공자와입문자의마음을사로잡은강의가개정판으로돌아왔다.최신버전인Pandas2.0버전에서추가되거나변경된내용을포함하여시계열데이터처리등의기법과사례등을더해150쪽이상의분량이더해졌다.특히시계열데이터의효율적인처리와분석을위한다양한기법을추가했다.시계열데이터는시간의흐름에따른연속적인값으로,미래를예측하고그에맞는전략을세우는데큰도움이되기때문에주식,환율등금융데이터에특히많이쓰인다.데이터분석에서중요한부분이기때문에다른자료형을시계열객체로변환하는것부터시계열데이터처리기법까지사례를대폭추가해시간에따른데이터변화를효과적으로분석할수있도록했다.또한시계열데이터처리강화와더불어,데이터전처리기법을더욱다양화했다.데이터정제,변환,통합등다양한데이터전처리기법을추가하여데이터분석의기초를더욱탄탄히다질수있도록했다.데이터의시각적표현을위한다양한기법과도구역시새롭게포함했으며,데이터시각화개선으로복잡한데이터를직관적으로이해하고전달하는기법을더욱쉽게배울수있다.그리고이모든과정을실습중심으로진행한다.지루하고복잡한이론은최소화하고,실무에바로적용할수있는실습예제를풍부하게담았다.파이썬소개와기초문법에대한설명을생략하고예제의수를늘렸기때문에파이썬리스트,딕셔너리등의자료구조와반복문,조건문등의기본문법을알고있는독자라면이책한권으로정확하고빠르게실력을향상시킬수있다.책속예제코드를하나씩실행하다보면파이썬데이터분석과자연스럽게가까워질수있을것이다.이책을통해,데이터를수집하고분석하는일을즐기게될여러분을환영한다.