파이썬 데이터 분석가 되기+챗GPT

파이썬 데이터 분석가 되기+챗GPT

$27.85
Description
★ 파이썬으로 데이터 분석을 하고 싶다면?
★ 파이썬 입문 그다음에 꼭 보세요!
★ ‘패스트캠퍼스’, ‘메가스터디’ 셀레나 쌤과 함께 실패 없이 완주하세요!
실력을 갖춘 데이터 분석가로 성장하려면 시작이 중요합니다. 그래서 이 책은 무엇부터 익혀야 하는지 막막한 입문자에게 데이터 분석 로드맵을 제시하고 개념과 실습, 그리고 실무팁까지 차근차근 설명합니다. 또한 챗GPT로 공부하는 방법을 함께 소개하여 다양한 관점에서 데이터 분석을 학습할 수 있도록 준비했습니다. 이어서 파이썬 데이터 분석에 꼭 필요한 5대장인 넘파이, 판다스, 맷플롯립, 시본, 뷰티풀수프를 최신 트렌드에 맞게 그리고 실무에 유용하게 알려줍니다. 모든 장 끝에는 연습문제가 수록되어 있어 배운 내용을 점검할 수 있습니다.

〈되기〉 시리즈 소개
〈되기〉 시리즈는 이름 그대로 IT 분야에서 성장하려는 여러분을 위해 준비한 책입니다. 엄선된 IT 기술들을 로드맵과 함께 제시하고, 실무 중심으로 공부할 수 있도록 안내합니다. 여러분이 해당 분야에서 실무자로 빠르게 성장할 수 있도록 지원하겠습니다.

저자

셀레나

저자:셀레나
패스트캠퍼스,메가스터디,국비지원강의를통해5,000명이상의수강생을온라인과오프라인에서만나며데이터분석을가르쳐왔습니다.수강생들이데이터분석을처음접할때겪는어려움과고민을가까이에서지켜보며,어떻게하면더쉽게이해하고실습할수있을지끊임없이고민했습니다.이러한경험을바탕으로누구나부담없이데이터분석을시작할수있는안내서가되기를바라며이책을집필하였습니다.
강의및컨설팅
-패스트캠퍼스:'실패없이완주하는파이썬데이터분석입문'강의런칭
-삼성전자:CitizenDeveloper양성과정'파이썬프로그래밍기초'
-대한의료정보학회:'의료데이터를활용한실전분석'튜토리얼
-서강대학교,숙명여자대학교,한국교통대학교:'파이썬을활용한머신러닝및데이터분석실습'외강의및컨설팅진행
저자오픈채팅방
-open.kakao.com/o/gm8FtZUg
저자유튜브
-youtube.com/@SELENASSAM

목차

01장수치계산라이브러리,넘파이


_01.1넘파이와의첫만남
__넘파이사용하기


_01.2넘파이배열,ndarray
__1차원배열알아보기
__2차원배열알아보기
__3차원배열알아보기
__넘파이배열의축이해하기
__넘파이의축번호는왜그럴까?
__넘파이배열의데이터타입살펴보기
__데이터타입확인해보기
__넘파이배열의장점알아보기
__다양한방법으로넘파이배열생성하기
__넘파이배열속성이해하고출력해보기
__[챗GPT와함께]넘파이3차원배열생성해보기
__초기화함수로넘파이배열생성하기
__일정한간격의넘파이배열생성하기
__arange()함수와linspace()함수비교하기


_01.3넘파이배열로다양하게연산하기
__요소별연산해보기
__[챗GPT와함께]넘파이사칙연산구하기
__수학함수,집계함수와함께벡터화연산해보기


_01.4배열인덱싱과슬라이싱
__인덱스이해하기
__단일요소인덱싱이해하기
__슬라이싱이해하기
__논리형인덱싱이해하기
__정수배열인덱싱이해하기
__[챗GPT와함께]넘파이배열의슬라이싱을다른프로그래밍언어와비교하기


_01.5배열의형태변형하기
__배열의형태를변형하여새배열을반환하는reshape()함수
__[챗GPT와함께]reshape()함수에서-1을쓰는이유는뭘까?
__원본배열의형태를변형하는resize()함수
__1차원배열로변형하기
__전치연산하기


_01.6배열합치고분할하기
__배열합치기
__배열분할하기
__학습마무리
__연습문제


02장데이터처리라이브러리,판다스


_02.1판다스시작하기
__판다스와넘파이의특징
__판다스와넘파이의관계
__판다스를사용해야하는이유
__시리즈란?
__데이터프레임이란?
__데이터다운로드하고다시업로드하여살펴보기
__판다스의데이터타입알아보기
__[챗GPT와함께]샘플데이터생성후판다스에서읽어보기


_02.2데이터내용확인하기
__데이터의열과행확인하기
__데이터의처음과마지막부분확인하기
__데이터구조살펴보기
__[챗GPT와함께]데이터구조살펴보기


_02.3특정열선택하기
__시리즈반환하기
__데이터프레임반환하기
__[챗GPT와함께]판다스특정열선택을조건으로활용하기(1)
__[챗GPT와함께]판다스특정열선택을조건으로활용하기(2)


_02.4데이터필터링하기
__비교연산자〉로필터링하기
__부정연산자~로필터링하기
__논리연산자&나|로필터링하기
__[챗GPT와함께]데이터필터링기능활용하기
__loc[]와iloc[]로필터링하기
__isin()함수로특정값필터링하기
__[챗GPT와함께]isin()함수와조건문비교하기


_02.5결측치처리하기
__결측치가뭐죠?
__결측치처리가중요한이유?
__결측치처리,어떻게해야할까요?
__결측치확인하기
__결측치처리하기
__결측치를처리한데이터프레임을파일로저장하기
__[챗GPT와함께]결측치에대해물어보자!


_02.6데이터통계처리하기
__통계구하기
__그룹별집계하기
__[챗GPT와함께]agg()함수를이용하여통계분석하기


_02.7데이터프레임에행이나열추가하거나삭제하기
__행과열추가하기
__행과열삭제하기
__학습마무리
__연습문제


03장데이터시각화라이브러리,맷플롯립


_03.1맷플롯립시작하기
__맷플롯립소개
__맷플롯립사용하기
__[챗GPT와함께]맷플롯립장점알아보기


_03.2그래프꾸미기
__축과관련있는옵션사용해보기
__선과관련있는옵션사용해보기
__[챗GPT와함께]맷플롯립그래프색상설정하기
__제목관련옵션사용해보기
__그래프배경관련옵션사용해보기
__[챗GPT와함께]맷플롯립그래프그리기


_03.3다양한그래프그려보기(1)
__타이타닉데이터셋소개
__선그래프:객실등급에따른생존율표시하기
__수직막대그래프:각승선항구에따른생존자수확인하기
__수평막대그래프:각승선항구에따른생존자수확인하기
__산점도그래프:나이와요금,생존여부확인하기
__파이차트:생존자,사망자비율표현하기
__히스토그램:승객의나이분포표시하기


_03.4다양한그래프그려보기(2)
__히트맵:두변수의상관관계를표시하기
__영역채우기그래프:나이대별생존자와사망자수표현하기
__박스플롯:승객나이의데이터분포,중앙값,이상치살펴보기
__바이올린플롯:승객등급에따른나이분포표시하기
__[챗GPT와함께]맷플롯립박스플롯과바이올린플롯활용에대해알아보기
__에러바:요금의평균과표준편차표현하기
__[챗GPT와함께]맷플롯립에러바를이용한기업월간주가확인하기


_03.5그래프한꺼번에그려보기
__여러종류의그래프그리는방법원리설명
__개별서브플롯을하나씩생성하기
__타이타닉데이터셋으로개별서브플롯하나씩그리기
__개별서브플롯을동시에생성하기
__타이타닉데이터셋으로개별서브플롯동시에그리기
__하나의서브플롯에여러그래프그리기
__[챗GPT와함께]타이타닉승객등급별요금분포와생존율시각화하기


_03.6그래프저장하기
__학습마무리
__연습문제


04장데이터시각화라이브러리,시본
__04.1시본기본개념
__시본자체데이터셋불러오기
__팁데이터셋불러오기
__[챗GPT와함께]Seaborn은왜별칭이sns일까?


_04.2여섯가지그래프이해하기
__시본그래프는어떤것들이있을까?
__범주형변수산점도그래프
__빈도그래프
__선형회귀선이있는산점도그래프
__히스토그램과커널밀도추정그래프
__조인트그래프
__관계그래프
__[챗GPT와함께]이상치탐지그래프는어떤그래프로?
__학습마무리
__연습문제


05장웹데이터수집라이브러리,뷰티풀수프


_05.1웹데이터수집기본개념
__웹데이터를수집할때주의할점
__[챗GPT와함께]robots.txt알아보기
__[챗GPT와함께]야후파이낸스와네이버파이낸스의robots.txt비교하기
__웹데이터수집용어정리하기
__웹스크래핑은어떤과정으로수행될까?
__뷰티풀수프기초사용방법알아보기
__웹스크래핑원리이해하기


_05.2야후파이낸스주가데이터웹스크래핑하기
__웹페이지파악하기
__헤더에사용자에이전트값추가하기
__삼성전자종목일별시세페이지요청하기
__뷰티풀수프로데이터추출하고날짜,원표시하기
__for문으로순회하면서전체날짜,종가데이터가져오기
__수집한데이터로그래프시각화하기
__[챗GPT와함께]날짜와종가데이터로막대그래프그리기346
__[챗GPT와함께]주식데이터를웹스크래핑할추가적인사이트349
__학습마무리
__연습문제


06장넷플릭스데이터분석프로젝트


_06.1넷플릭스데이터분석프로젝트소개
__여기서사용하는라이브러리
__데이터분석목표
__데이터전처리과정
__데이터시각화미리보기


_06.2넷플릭스데이터셋파악하기
__캐글의넷플릭스데이터셋?
__[챗GPT와함께]캐글의데이터분석할데이터셋추천받기!
__넷플릭스데이터셋변수살펴보기
__넷플릭스데이터셋불러와살펴보기


_06.3넷플릭스데이터셋결측치처리하기
__넷플릭스결측치비율확인하고처리하기


_06.4넷플릭스피처엔지니어링하기
__피처엔지니어링은어디에쓰이나요?
__[챗GPT와함께]피처엔지니어링더해보기


_06.5넷플릭스시각화하기380
__데이터전처리완료한데이터셋불러오기
__넷플릭스색상시각화하기380
__넷플릭스오징어게임검색하기
__넷플릭스파이차트그리기
__넷플릭스막대그래프그리기
__넷플릭스히트맵그리기
__넷플릭스워드클라우드
__[챗GPT와함께]워드클라우드더해보기
__학습마무리


07장의료데이터분석프로젝트


_07.1의료데이터분석프로젝트소개
__여기서사용하는라이브러리
__데이터분석목표
__데이터전처리과정
__데이터시각화미리보기


_07.2의료데이터셋파악하기
__심부전데이터셋이란?
__심부전데이터셋불러온다음내용확인하기


_07.3심부전데이터셋필터링하기
__논리형인덱싱으로데이터필터링하기


_07.4심부전데이터셋결측치처리하기
__결측치비율확인하기
__결측치처리하기
__결측치처리후에결측치개수다시확인하기
__[챗GPT와함께]결측치를처리하는방법이궁금해!


_07.5심부전데이터셋통계처리하기
__평균값과중앙값구하기
__열의빈도수구하기
__통계량요약하기
__그룹별집계하기
__[챗GPT와함께]심부전데이터셋을이용한피처엔지니어링


_07.6심부전데이터셋시각화하기
__심부전색상시각화하기
__심부전파이차트그리기
__심부전빈도그래프그리기
__심부전데이터영역그래프그리기
__심부전범주형산점도그래프그리기
__심부전워드클라우드그리기
__[챗GPT와함께]추가적인시각화를진행해보자
__학습마무리

출판사 서평

책속에서

★환영합니다,파이썬입문그다음책을소개합니다!환영합니다.데이터분석가가되고싶은데무엇을어떻게할지모르겠는분이라면,잘찾아오셨습니다.이책은파이썬을공부했거나,데이터분석에입문하고싶은분들에게필요한내용을알려줍니다.데이터분석의기본을체계적으로다지고싶은예비데이터분석가에게유용합니다.처음에공부하면이해하기어려운추상적인데이터구성은그림과함께설명하여아주쉽게읽을수있습니다.데이터분석분야에꼭필요한파이썬,넘파이,판다스,맷플롯립,시본,그리고데이터수집에필요한뷰티풀수프까지!이책한권으로데이터분석에입문해보세요!
파이썬데이터분석5대장으로공부하세요

하나,넘파이넘파이는파이썬에서수치계산을효율적으로처리하는라이브러리입니다.다차원배열객체인ndarray를제공하며,벡터및행렬연산을빠르게수행할수있습니다.또한,다양한수학함수와통계함수도지원하여데이터분석,과학계산,머신러닝등에널리사용됩니다.

둘,판다스판다스는파이썬에서데이터분석을쉽게할수있도록돕는라이브러리입니다.주로표형식의데이터를다루는데사용되며,데이터프레임과시리즈같은자료구조를제공해데이터조작,필터링,정렬,집계등을효율적으로처리합니다.엑셀,CSV등다양한파일형식에서데이터를불러오고처리할수있어데이터분석,전처리에널리활용됩니다.

셋,맷플롯립파이썬에서데이터를시각화하는라이브러리입니다.다양한유형의차트(선그래프,막대그래프,산점도등)를만들수있으며,데이터를시각적으로표현해분석및인사이트도출을돕습니다.그래프의스타일,레이블,축등을세밀하게조정할수있어데이터시각화에유연성과강력한기능을제공합니다.데이터분석,보고서작성,프레젠테이션등에자주사용됩니다.

넷,시본시본은파이썬의데이터시각화라이브러리로,맷플롯립을기반으로더간편하고아름다운그래프를만들수있도록도와줍니다.시본은데이터분석에자주쓰이는히트맵,카테고리형그래프,분포형그래프등을손쉽게만들수있습니다.특히판다스와잘통합되어데이터프레임을직접시각화할때유용합니다.시본을사용하면그래프의스타일과색상팔레트를간단하게조정할수있습니다.

다섯,뷰티풀수프뷰티풀수프는웹페이지의HTML이나XML문서를파싱하여데이터를추출하는파이썬라이브러리입니다.웹스크래핑을할때주로사용하며,웹사이트의구조를분석해원하는데이터(텍스트,링크,이미지등)를손쉽게추출할수있습니다.웹페이지에서데이터를가져오고,그내용을파싱해필요한정보를추출하는과정에서매우유용합니다.뷰티풀수프는복잡한HTML구조도직관적으로탐색할수있도록돕습니다.

〈되기〉시리즈는여러분에게앞으로나아갈길을먼저제시합니다
입문자를위한데이터분석로드맵을만나보세요데이터분석에입문할때겪은난감함을생각했습니다.무엇을어떻게할지몰랐습니다.로드맵이
필요했습니다.하지만누구도제대로된로드맵을제공해주지않았습니다.그래서이책은로드
맵을제공합니다.로드맵에는수많은기술이나열되어있습니다.책한권에로드맵에있는모든걸담을수도,한번에모두배울수도없지만데이터분석입문에꼭필요한내용은모두담기위해노력했습니다.로드맵과함께어떤방향으로나아가야할지바라보며공부해보세요.
-온라인에서보는로드맵:roadmap.sh/r/rdm-q8fbj
실무에유용한기술로익히세요기술은빠르게변합니다.지금은대세이지만지는기술,아직은미약하지만뜨는기술이있습니다.트렌드가변하는데는그럴만한이유가있습니다.반면기본은트렌드와무관하게변하지않습니다.그래서기본은탄탄하게,기술셋은트렌디하면서실무에유용하게설명했습니다.
챗GPT와함께공부하세요이제는챗GPT를사용하지않는사람이없습니다.챗GPT가만능은아니지만잘만사용하면어려운문제를쉽게해결할수도있고,모르는내용을더쉽게공부할수도있습니다.다만챗GPT는질문에기술이필요하고,잘쓰는사람은어떻게질문하는지알아둘필요가있습니다.그래서이책은중간중간챗GPT와함께공부합니다.선생님의질문노하우를보면서챗GPT와함께공부해보세요.
200%학습효율이오르는7가지학습가이드초보자가데이터분석에필요한환경설정을하는건너무어려운일입니다.물론제대로된환경을만들고싶을수도있습니다만그보다더중요한건기초개념을실습하고익히는것이죠.그래서이책은설치없이바로공부할수있도록구글드라이브와구글코랩으로실습을안내합니다.
하나,구글에가입하세요(무료)구글에가입하면파이썬데이터분석을할수있는코랩을무료로사용할수있습니다.구글계정
을준비해주세요.
둘,내드라이브에코랩파일을만드세요내드라이브에적당한폴더를만든다음마우스오른쪽클릭→더보기→GoogleColaboratory를누르면구글코랩파일을만들어코랩을사용할수있습니다.
셋,코랩에서코드를입력하고실행해보세요처음파일을만들면코드를입력할수있는줄이있습니다.만약새로운코드를입력하고싶으면[+코드]를누르면코드를입력할수있는줄이생깁니다.코드를다입력한다음에는▶를누르거나[Shift+Enter]를누르면코드를실행합니다.코드를실행한결과는코드줄아래에바로생깁니다.코드를실행하면바로다음줄에입력할수있는줄이생깁니다.
넷,실습용파일,완성파일은모두여기에있습니다실습에필요한파일이나완성파일은모두bit.ly/4dXk2Ef에장별로구분하여업로드해두었습니다.다운로드링크는실습진행중에바로확인할수있도록본문에서도안내합니다.필요할때마다다운로드하여활용하세요.
다섯,실습화면을왼쪽에,정답화면을오른쪽에놓고실습하세요데이터분석이처음이라면내가입력한코드가잘실행되지않을수있습니다.초보라면당연한일입니다.이책은그런여러분들을위해실습환경파일과정답파일을병렬로제공합니다.실습화면을왼쪽에,정답화면을오른쪽에두고실습해보세요.
여섯,저자선생님과함께!오픈카톡방을활용하세요책으로봐도,정답코드를봐도어렵다면?!저자선생님과함께공부해보세요.데이터분석입문자에게길을열어주고싶은선생님이오픈카톡방에계십니다.오픈카톡방의명령어를활용해서다양한자료도쉽게얻어보세요.
-오픈카톡방링크:open.kakao.com/o/gm8FtZUg
일곱,유튜브강의도활용해보세요저자선생님유튜브동영상강의도있습니다.함께공부하거나이동하면서공부하고싶을때유튜브채널에방문하여영상으로공부해보세요.
-유튜브채널링크[셀레나쌤]:youtube.com/@SELENASSAM