데이터 사이언티스트 실전 노트 (데이터 핵심부터 포트폴리오까지, 한 권으로 돌파하기)

데이터 사이언티스트 실전 노트 (데이터 핵심부터 포트폴리오까지, 한 권으로 돌파하기)

$30.00
Description
이 시대의 가장 섹시한 직업, 데이터 사이언티스트?!
소문만 무성한 데이터 사이언티스트의 모든 것을 알려드립니다!
1. 데이터 사이언티스트의 실제 업무를 알려드리고, 데이터 사이언티스트가 되기 위한 필수 역량을 체크리스트로 알려줍니다.
막연하게 데이터 사이언티스트를 꿈꾸는 것은 이제 그만! 데이터 사이언티스트의 업무가 무엇인지 정확히 이해하고 그 업무를 해결하기 위한 필수 역량이 적힌 체크리스트를 확인해 보세요! 체크리스트를 기반으로 계획을 세워 공부하다 보면, 어느새 여러분은 데이터 사이언티스트에 한 발짝 가까워질 거예요!

2. 현업에서 일어나는 실제 상황 속, 데이터 사이언티스트의 해결 방법을 알려줍니다.
현업에서 데이터 사이언티스트가 마주하는 상황 속, 해결 방법을 알려드립니다. ‘내가 이런 상황에 있다면 나는 어떻게 해야 할까? 어떻게 하는 것이 옳을까?’ 스스로 가치 판단면서 상황을 해결해가는, 진짜 데이터 사이언티스트가 될 수 있어요!

3. 매력적인 포트폴리오 작성법을 알려줍니다.
취업/이직 시장에서는 매력적인 포트폴리오를 작성하는 것이 가장 중요합니다. 데이터 사이언티스트의 업무도 잘 모르는데, 매력적인 포트폴리오 작성하기란 너무 쉽지 않죠?
매력적인 포트폴리오로 취업하고, 이직 시장에서 경쟁력을 갖추는 비법을 싹 다 공개할 테니, 이제 매력적인 데이터 사이언티스트로 거듭나세요!

4. 데이터 분석을 위한 기초 파이썬과 기본 통계 지식은 덤!
데이터 분석, 더 이상 맨땅에 헤딩하지 마세요! 데이터 분석을 위해 꼭 필요한 기초 파이썬과 기본 통계 지식을 덤으로 배워갈 수 있습니다. 배워야 할 것은 빠르게 습득하여, 유능한 ‘데이터 사이언티스트’로 성장하세요!
선정 및 수상내역
2023 세종도서 학술부문 선정
저자

이지영

이화여자대학교언론정보학과를졸업하고외국계홍보회사에서근무했다.데이터를다루고싶어캐나다토론토대학교(UniversityofToronto)에서다시응용통계학을공부한후,요크대학교(YorkUniversity)에서응용통계학석사과정을무사히마쳤다.현재는토론토에거주하며데이터과학자로일하고있다.유튜브채널〈DataScientist이지영〉에서토종문과출신에서이과로전향한경험을바탕으로어떻게통계공부를하면좋은지,데이터사이언티스트의현업에대한내용을공유하고있다.

목차

저자소개
서문
베타리더추천사
이책의구성
1장데이터사이언티스트이해하기
1.1데이터직무알아보기
1.1.1데이터직무세가지:데이터분석가,데이터엔지니어,데이터사이언티스트
1.1.2데이터직무별갖춰야할필수능력
1.2데이터사이언티스트를왜하필데이터사이언티스트라고할까
1.2.1회사가데이터사이언티스트에게바라는점
1.2.2진짜데이터사이언티스트가갖춰야할역량
1.3데이터사이언티스트를희망한다면이것부터살펴라
1.3.1관련전공자와석·박사를우대하는현실
1.3.2체크리스트로보는나는무엇을키워야할까
2장데이터사이언티스트에서“데이터”
2.1데이터유형
2.1.1정형데이터(StructuredData)
2.1.2비정형데이터(UnstructuredData)
2.1.3반정형데이터(Semi-structuredData)
2.1.4내게필요한데이터유형은무엇일까?
2.2데이터에서확인해야할사항
2.2.14가지상황에서살펴본데이터크기(Size)
2.2.2데이터의값에따른종류
2.2.3결측치(MissingValue)
2.2.4중복데이터
2.2.5식별키(PrimeKey,PrimaryKey)
2.2.6상황으로살펴보는스키마생성예시
2.3데이터합치기
2.3.1데이터프레임결합:pd.merge()
2.3.2데이터프레임결합:df_left.join(df_right,...)
2.3.3여러데이터프레임연결:pd.concat()
2.3.4데이터프레임,배열,리스트,딕셔너리연결:.append()
2.3.5상황으로살펴보는데이터합치기활용
3장데이터사이언티스트에서“사이언티스트”
3.1데이터사이언티스트는무엇을하는사람인가
3.1.1질문을통해문제점찾기
3.1.2수학과통계얼마나잘해야할까
3.2기본통계로질문자되기
3.2.1평균인μ와,무엇이다를까?
3.2.2수학과통계는무엇이다를까?
3.2.3확률,가능도,최대가능도추정,통계차이는?
3.2.4통계vs.머신러닝그리고모수vs.비모수차이는무엇일까?
3.2.5정규분포를포함한분포는결국OO이다
3.2.6분포는무엇으로결정될까?
3.2.7중심경향값을계산하는대표적인세가지는무엇일까?
3.2.8중심경향을제외한분포파악에필요한통계치는무엇일까?
3.2.9적률로이해하는분포특징4가지
3.2.10피처스케일링할것인가,말것인가?지도학습사용목적으로판단하기
3.2.11피처스케일링방법중선택기준이있을까?
3.2.12꼭분포를바꿔야할까?로그변환,파워변환에서손실과이익을따져보기
3.2.13중심극한정리에서시작하는추리통계
3.2.14[가설검정(1)-가설설정]귀무가설을????̅=0이라고하면안되는이유
3.2.15[가설검정(2)-유의수준]가설을선택하는기준&선택에따른오류
3.2.16[가설검정(3)-검정통계량]통계방법선택하는방법
3.2.17[가설검정(4)-αvs.p-value,임계치vs.검정통계량]가설검정결론내리기
3.2.18두개이상의변수관계를이해할때알아야할개념:공분산,상관계수,선형성,공선성,다중공선성
3.2.19차원의저주란무엇일까?
3.2.20저주를풀어줄PCA란?
3.2.21필요한변수만선택해야할때어떤방법이좋을까?
3.3100개지식을아는사람vs.110개지식을아는사람,누가진정한데이터사이언티스트일까?
4장데이터사이언티스트가하는일
4.1직장인으로서데이터사이언티스트
4.1.1피할수없는‘업무정의의모호성’
4.1.2업무를제대로이해하는방법
4.1.3업무의방향성을지켜줄두가지의방법
4.1.4당신을돋보이게할상황에따른커뮤니케이션방법
4.2꼭알아야할키워드
4.2.1모델의수익화(WebAPI)
4.2.2불확실성(Uncertainty)다루기
4.2.3모델해석능력(Interpretability)
4.2.4업무효율성-자동화머신러닝,파이프라인
5장포트폴리오로시작하기
5.1왜포트폴리오일까?
5.2당신을함정에빠뜨릴포트폴리오
5.2.1누구나다아는데이터
5.2.2복사&붙여넣기식의포트폴리오
5.2.3양vs.질:양을선택한포트폴리오
5.3포트폴리오예시
5.3.1주제찾기&문제점제시
5.3.2데이터
5.3.3해결과정
5.3.4결과
5.3.5플랫폼선택,문서화
5.3.6재검토
5.3.7마치며
에필로그
찾아보기

출판사 서평

데이터사이언티스트가되기위해서라면가장먼저풀어야할,
데이터사이언티스트의오해와진실

데이터사이언티스트에대한소문은익히들어왔습니다.하지만소문만무성할뿐,진짜데이터사이언티스트의업무는무엇인지,데이터사이언티스트가되기위해서는무엇을해야하는지정확히알지못하는경우가많습니다.하지만데이터사이언티스트가되기위해선가장먼저그를둘러싼오해와진실부터풀어야합니다.
그래서“데이터사이언티스트의실전노트”를준비했습니다.데이터사이언티스트로현업에서일하고있는선배의이야기를하나하나친절하게담았습니다.
전혀늦지않았습니다.이도서와함께지금당장이시대의가장섹시한직업,데이터사이언티스트가되어보세요!