파이썬으로 배우는 데이터 과학 (데이터 전처리부터 탐색적 분석, 데이터 시각화, 추론 및 예측까지)

파이썬으로 배우는 데이터 과학 (데이터 전처리부터 탐색적 분석, 데이터 시각화, 추론 및 예측까지)

$36.00
Description
데이터 과학자로 시작하기 위한 이론과 실무 설명서!
이 책은 데이터 과학이 무엇인지 알려줍니다. 잠깐 생겼다가 사라지는 기술이 아닌 데이터 과학의 기본 구성 요소를 제공합니다. 데이터 과학의 한 부분만을 다루는 것이 아닌 데이터를 어떻게 해석하고 전체 주기를 따르면서 데이터 분석의 처음과 끝을 다룰 수 있게 도와주고 있습니다.

이 책은 6개의 부와 21개의 장으로 이루어져 있습니다.
1부 (1-5장)
1부는 데이터 과학 주기 전반을 기초적인 수준으로 훑어보면서 데이터 과학 주기에 대해서 설명
하고, 이 책 전반에서 사용하는 개념을 소개합니다. 이 부는 버스 도착 시간에 대한 짧은 예제로
마무리합니다.
2부 (6-7장)
2부에서는 데이터프레임과 데이터 간의 관계, 판다스(pandas)와 SQL을 사용해서 데이터를 다
루는 코드를 어떻게 작성하는지를 다룹니다.
3부 (8-12장)
3부는 데이터를 획득하고, 데이터의 특징을 탐색하고, 문제점을 찾아내는 것을 다룹니다. 이런
개념을 이해하고 나면, 데이터 파일을 가지고 데이터셋의 흥미로운 점을 발견하고 다른 사람들
에게 제시할 수 있을 것입니다. 이 부는 대기질에 대한 예제로 마무리합니다.
4부 (13-14장)
4부에서는 널리 사용되는 대안 데이터인 텍스트, 바이너리, 인터넷에서 가져오는 데이터에 대
해 살펴봅니다.
5부 (15-18장)
5부에서는 데이터를 사용해서 상황을 이해하는 법을 살펴봅니다. 여기서는 모델 적합, 피처 엔
지니어링, 모델 선택뿐만 아니라 가설 검정과 신뢰 구간 같은 추론 관련 주제도 다룹니다. 이
부의 말미에는 케냐의 수의사들이 당나귀 체중을 예측하는 것에 대한 예제를 다룹니다.
6부 (19-21장)
6부에서는 회귀 분석과 최적화를 사용한 지도 학습을 학습하며 이 책을 마무리합니다. 이 부의
끝에서는 뉴스 기사가 진짜인지 가짜인지 예측하는 예제를 다룹니다.

이 책의 부록에는 이 책에서 소개한 많은 주제에 대해서 더 학습하고자 할 때 필요한 자료와 이 책에서 사용한 데이터셋 목록을 추가했습니다.

【 대상 독자층 】
- 데이터 과학을 처음 배우는 대학생, 직장인
- 통계적 사고와 데이터 분석 실습을 배우고 싶은 사람
- 데이터 과학자의 분석 처리 방법을 단계별로 배워 보고 싶은 사람
저자

샘라우

SamLau
캘리포니아대학교샌디에이고(UniversityofCalifornia,SanDiego)의할리시올루데이터과학연구소(HalicioğluDataScienceInstitute)조교수입니다.10년간의교육경험을바탕으로UC버클리와UC샌디에이고에서대표적인데이터과학과정을설계하고가르치는데기여해왔습니다.

목차

1부데이터과학주기
1장데이터과학주기
1.1데이터과학주기의단계
1.2데이터과학주기를보여주는예제
1.3정리

2장질문과데이터범위
2.1빅데이터와새로운기회
2.2대상집단,접근프레임,표본
2.3수단및프로토콜
2.4자연현상측정
2.5정확도
2.6정리

3장시뮬레이션과데이터설계
3.1항아리모델
3.2예제:선거여론조사의편향과변동시뮬레이션
3.3예제:백신무작위임상시험시뮬레이션
3.4예시:대기질측정
3.5정리

4장요약통계량모델링
4.1상수모델
4.2손실최소화
4.3정리

5장예제:왜내가타는버스는맨날늦을까?
5.1질문과범위
5.2데이터전처리
5.3버스시간탐색
5.4대기시간모델링
5.5정리

2부테이블데이터
6장Pandas를사용한데이터프레임다루기
6.1나누기
6.2집계
6.3조인
6.4변환
6.5데이터프레임은다른데이터표현형과어떻게다를까?
6.6정리

7장SQL을사용해서관계형데이터다루기
7.1나누기
7.2집계
7.3조인
7.4변환과공통테이블표현식(CTE)
7.5정리

3부데이터이해
8장파일처리
8.1데이터예제
8.2파일형식
8.3파일인코딩
8.4파일크기
8.5쉘과명령어
8.6테이블의형태및구분방식
8.7정리

9장데이터프레임전처리
9.1예제:마우나로아관측소에서의CO_2측정치전처리
9.2품질확인
9.3결측치와기록
9.4데이터변환과타임스탬프
9.5구조변경
9.6예제:식당안전성위반사항전처리
9.7정리

10장탐색적데이터분석
10.1특성유형
10.2분포를확인할때
10.3관계를확인할때
10.4다변량경우의비교
10.5탐색시의지침사항
10.6예제:주택거래가
10.7정리

11장데이터시각화
11.1구조파악을위한축의범위선택
11.2데이터평활법과집계
11.3의미있는비교유도하기
11.4데이터설계통합
11.5맥락추가하기
11.6plotly를사용해서그래프그리기
11.7그외시각화도구
11.8정리

12장예제:대기질측정내용은얼마나정확할까요?
12.1질문,설계,범위
12.2근처에배치된센서찾기
12.3AQS센서데이터전처리
12.4퍼플에어센서데이터전처리
12.5퍼플에어와AQS측정치탐색
12.6퍼플에어측정치보정을위한모델생성
12.7정리

4부다른유형의데이터
13장텍스트다루기
13.1텍스트와처리작업예제
13.2문자열조작
13.3정규표현식
13.4텍스트분석
13.5정리

14장데이터교환
14.1NetCDF데이터
14.2JSON데이터
14.3HTTP
14.4REST
14.5XML,HTML및XPath
14.6정리

5부선형모델링
15장선형모델링
15.1단순선형모델
15.2예제:대기질측정을위한단순선형모델
15.3단순선형모델적합화
15.4다중선형모델
15.5다중선형모델적합화
15.6예제:어디에기회의땅이있습니까?
15.7수치측정치를위한특성공학
15.8범주형측정치를위한특성공학
15.9정리

16장모델선택
16.1과적합
16.2훈련-테스트분할
16.3교차검증
16.4정규화
16.5모델편향및분산
16.6정리

17장추론및예측이론
17.1분포:모집단,경험치,표본추출
17.2가설검정의기본사항
17.3추론을위한부트스트랩
17.4신뢰구간의기본사항
17.5예측구간의기본사항
17.6추론및예측을위한확률
17.7정리

18장예제:당나귀의체중을재는법
18.1당나귀연구의질문및범위
18.2전처리및변환
18.3탐색
18.4당나귀의체중모델링
18.5정리

6부분류
19장분류
19.1예제:바람에피해를입은나무
19.2모델링및분류
19.3비율(및확률)모델링
19.4로지스틱모델의손실함수
19.5확률에서분류로
19.6정리

20장수치최적화
20.1경사하강법의기본사항
20.2후버손실최소화하기(MinimizingHuberLoss)
20.3볼록하고미분가능한손실함수
20.4경사하강법의변형
20.5정리

21장예제:가짜뉴스탐지
21.1질문과범위
21.2데이터수집및전처리
21.3데이터탐색
21.4모델링
21.5정리

부록1추가자료
부록2데이터원본

출판사 서평

이책은가장기본적인데이터과학의주기를알려주는것으로시작합니다.가장기초적이면서도가장중요한부분입니다.데이터를얻고,이해하고,상황을이해하는것은데이터과학자가갖춰야하는기본적인소양이라고할수있습니다.그리고데이터를아무리많이갖고있더라도제대로된질문이없다면데이터분석에의미가없어집니다.이책은실제데이터를다루면서질문을시작으로어떻게탐색할수있는지를보여줍니다.
이론적으로생각해야할전체적인과정과실제데이터를통해어떻게분석하고예측할수있는지설명하고있어데이터과학자라면꼭필요한내용을배울수있었습니다.
이책에있는분석방법과예제를반복학습해보면서데이터과학자에입문해보시기바랍니다.