처음이야? 파이썬 데이터 분석 (동영상 강의로 배우는 259개 코드 따라하기)

처음이야? 파이썬 데이터 분석 (동영상 강의로 배우는 259개 코드 따라하기)

$25.93
Description
처음 배우는 사람도, 바로 따라 하며 익히는 파이썬 데이터 분석 입문서
『처음이야, 파이썬 데이터 분석』은 파이썬을 처음 접하는 사람도 바로 실습할 수 있도록 구성된 데이터 분석 입문서입니다. 복잡한 이론보다는 구글 코랩 환경을 활용한 실습 중심 구성으로, NumPy와 Pandas를 활용한 배열 계산, 데이터 전처리, 통계 요약, 고윳값 분석 등의 기능을 하나하나 따라 하며 익힐 수 있도록 짜임새 있게 설계되었습니다.

특히 설치 없이 웹에서 실습 가능한 구글 코랩 환경을 안내하여, 프로그램 설치에 어려움을 느끼는 초보자도 부담 없이 시작할 수 있습니다. 각 장마다 주요 이론과 실습 코드를 연결하고, 예제를 파일 단위로 제공하며, 이해를 돕는 팁과 주석으로 실무에 바로 연결할 수 있도록 돕습니다.

데이터 분석이 처음인 독자도, 엑셀만 써오던 직장인도 이 책 한 권으로 파이썬 기반 데이터 분석의 핵심 흐름을 이해하고 실무에 활용할 수 있습니다.
처음 시작하는 사람에게 가장 친절한 데이터 분석 길잡이, 바로 이 책입니다.

[이 책의 특징]
비개발자의 시선에서 시작하는 데이터 분석 입문서
복잡한 용어나 이론 중심 설명이 아닌, 실무 중심의 문제 해결과 업무 흐름 이해를 바탕으로 파이썬 분석을 쉽고 현실감 있게 소개합니다.

구글 코랩을 기반으로 한 설치 없는 실습 환경 제공
초보자도 환경 설정에 부담 없이 시작할 수 있도록 클라우드 실습 환경(Colab)을 중심으로 구성해 접근성을 높였습니다.

단계별 실습 문제와 코드 파일 제공
각 장마다 실습 문제와 해설 코드를 제공하여 학습 성과를 점검하고, 실무에 필요한 응용력을 키울 수 있습니다.

동영상 강의와 연동된 학습 지원
모든 실습 코드를 동영상으로 따라 하며 학습할 수 있도록 구성되어 있어, 독학이 어려운 분들도 눈으로 보고 손으로 익힐 수 있습니다.
저자

윤영빈,이용희,오환

저자:윤영빈
현수제비정보처리기사대표저자이자수제비코퍼레이션대표.실무와교육현장을넘나들며수많은수험생과개발지망생들에게실질적인도움을주는콘텐츠를제작하고있다.정보관리기술사로서의깊은전문성을바탕으로,자격증과실무를연결하는교육콘텐츠의선두주자로활동중이다.

저자:이용희
현재핀테크대기업에서근무중이며,과거게임,IoT등다양한분야의스타트업에서실전개발경험을쌓았다.소프트웨어마에스트로인증을받은이력을바탕으로,이론과실무를아우르는균형잡힌시각으로독자에게실질적인인사이트를제공한다.

저자:오환
데이터분석전문컨설팅사의대표로활동중이며,이전에는개발사대표와이집트문화재청근무경력을갖춘독특한이력을지니고있다.기술과문화,비즈니스현장을두루경험한강점을살려,데이터분석과시스템구축전반에걸친깊이있는통찰을전한다.

목차

1장데이터분석시작하기
1.1데이터분석
1.2개발환경구축(구글코랩)
구글코랩개요
구글코랩주요특징
구글코랩시작
구글코랩환경설정
데이터불러오기
코드작성및실행
깨짐오류해결
마무리실습문제
마무리실습문제정답

2장NumPy
2.1NumPy개요
NumPy개념
NumPy특징
NumPy확인
NumPy와리스트의차이점
2.2배열생성
np.array()함수
np.zeros()함수
np.ones()함수
np.full()함수
np.empty()함수
np.arange()함수
np.linspace()함수
2.3배열의주요속성
shape속성
dtype속성
size속성
ndim속성
flat속성
2.4배열의데이터타입
기본데이터타입
데이터타입변환-astype()함수
2.5배열의인덱싱
기본인덱싱
다차원배열인덱싱
음수인덱싱
다차원배열에서의음수인덱싱
Boolean인덱싱
팬시인덱싱
다중팬시인덱싱
2.6배열의슬라이싱
기본슬라이싱
다차원배열슬라이싱
슬라이싱을이용한행/열선택
음수슬라이싱
Boolean배열을사용한슬라이싱
배열을사용한슬라이싱
2.7배열의연산
산술연산
지수연산
배열의비교연산
배열과스칼라연산
논리연산
제곱근
2.8배열비교
요소별비교
배열간비교
np.all()
np.any()
np.array_equal()
2.9배열병합
2.10배열정렬
1차원배열정렬
다차원배열정렬
내림차순정렬
원본배열정렬-ndarray.sort()
다중조건정렬-np.lexsort()
2.11배열필터링
기본필터링
다차원배열필터링
np.where()를사용한필터링
마스크배열을이용한필터링-ma.array()
복합조건을사용한필터링
np.extract()를사용한조건기반추출
2.12배열의통계
최솟값-np.min()
최댓값-np.max()
데이터범위-np.ptp()
합계(Sum)-np.sum()
평균(Mean)-np.mean()
중위수(Median)-np.median()
분산(Variance)-np.var()
표준편차(StandardDeviation)-np.std()
사분위수(Quantiles)-np.percentile()
마무리실습문제
마무리실습문제정답

3장Pandas
3.1Pandas개요
Pandas개념
Pandas특징
Pandas확인
NumPy와Pandas
3.2Series
Series개념
Series특징
Series와리스트의차이점
Series생성방법
Series구조확인
데이터조회
인덱싱및슬라이싱
데이터추가
Series값수정
인덱스이름변경-rename()
데이터통계및요약
고윳값확인
데이터필터링및조건선택
Series의데이터연결-concat()
데이터정렬
데이터그룹화및집계
3.3DataFrame
DataFrame개념
DataFrame과리스트의차이점
DataFrame생성방법
DataFrame구조확인
데이터조회
인덱싱및슬라이싱
데이터추가
DataFrame값수정
열이름변경
데이터통계및요약
고윳값확인
데이터필터링및조건선택-다중조건필터링
데이터병합및결합
데이터정렬
데이터그룹화및집계
3.4Series와DataFrame
Series와DataFrame의차이점
마무리실습문제
마무리실습문제정답

4장matplotlib
4.1matplotlib개요
matplotlib개념
matplotlib설치
4.2matplotlib기능
플롯(Plot)
선그래프(LinePlot)
막대그래프(BarChart)
파이차트(PieChart)
산점도(ScatterPlot)
히스토그램(Histogram)
서브플롯(subplot)
플롯이미지
4.3seaborn개요및기능
seaborn개념
seaborn설치
히트맵(Heatmap)
클러스터맵(Clustermap)
박스플롯(Boxplot)
카운트플롯(Countplot)
마무리실습문제
마무리실습문제정답

5장데이터전처리
5.1데이터준비및불러오기
CSV파일불러오기
엑셀파일불러오기
JSON파일불러오기
5.2데이터탐색
데이터구조이해
통계적요약
5.3데이터전처리
데이터결측값처리
중복데이터제거
5.4데이터변환
데이터형식변환
범주형데이터인코딩
데이터정규화및표준화
데이터인덱싱
데이터슬라이싱
데이터정렬
5.5데이터저장
CSV형식으로저장
Excel형식으로저장
JSON형식으로저장
마무리실습문제
마무리실습문제정답

6장데이터분석
6.1마케팅및고객분석
6.2금융및리스크관리
6.3의료및헬스케어
6.4제조및품질관리
6.5공공정책및사회문제해결

7장케글(kaggle)실습
7.1케글(kaggle)개요
케글개념
케글특징
케글준비
7.2케글실습
타이타닉생존자예측문제(Titanic-MachineLearningfromDisaster)
주택가격예측문제(HousePrices-AdvancedRegressionTechniques)
신용카드사기탐지문제(CreditCardFraudDetection)

8장공공데이터실습
8.1공공데이터개요
공공데이터개념
공공데이터특징
8.2공공데이터실습
대기오염데이터분석
서울시자전거대여데이터분석
지역별인구통계데이터분석

별책부록핵심노트
핵심필기노트
핵심용어노트

출판사 서평

파이썬데이터분석이처음이라면,이책이가장좋은출발점이되어줄것입니다.『처음이야,파이썬데이터분석』은저자가실제강의와실습현장에서쌓아온노하우를바탕으로구성한도서로,단순한문법설명을넘어동영상과스터티를통해함께공부해나갑니다.구글코랩환경을기반으로설치부담없이바로실습할수있으며,NumPy와Pandas의기초부터통계분석과실무활용까지차근차근따라갈수있도록구성되어있어데이터분석의흐름을자연스럽게익힐수있습니다.숫자와코드에낯선분들도안심하고시작할수있도록예제와해설,팁을아낌없이담았습니다.데이터를읽고,이해하고,설명하고싶은모든분들께추천합니다.

[이책에서배우는내용]

데이터분석의기본개념과환경구축
데이터분석이무엇인지이해하고,구글코랩을통해별도설치없이실습가능한환경을설정합니다.초보자도클라우드기반환경에서파이썬분석을바로시작할수있습니다.

고성능수치계산을위한NumPy활용법
다차원배열을효율적으로다루기위한NumPy의주요함수와속성,인덱싱과슬라이싱기법,브로드캐스팅,통계계산등다양한기능을배우며배열기반연산의기초를다집니다.

Series와DataFrame을활용한Pandas실전분석기법
Pandas의핵심구조인Series와DataFrame을이용해데이터조회,정렬,필터링,통계,그룹화,결합등데이터분석에필수적인기능을실습중심으로익힙니다.

통계와시각화기반의데이터통찰도출
value_counts,describe,mean,std,groupby,apply등다양한통계함수로데이터를요약하고,시각화를통해통찰력을얻는방법을학습합니다.분석흐름에맞춘실전예제도함께제공합니다.