모두의 데이터 과학 with 파이썬 (수집 정리 탐구 예측 가치로 배우는 기초 데이터 과학 | 즐거운 프로그래밍 경험)

모두의 데이터 과학 with 파이썬 (수집 정리 탐구 예측 가치로 배우는 기초 데이터 과학 | 즐거운 프로그래밍 경험)

$22.11
Description
빅데이터 시대, 왜 데이터 과학인가? 데이터를 분석해 의미를 찾는 것이 중요하다!
[모두의 데이터 과학 with 파이썬]은 초보자와 비전공자가 배울 수 있게 최대한 전문 용어와 복잡한 수학을 사용하지 않고 설명한다. 먼저 데이터 과학의 개념을 알아보고, 데이터 과학에서 주로 사용하는 파이썬의 핵심 내용을 살펴본다. 또한 HTML, CSV, JSON 파일, 수치형 및 테이블형 데이터를 Beautiful Soup, NLTK, NumPy, Pandas를 사용해 분석하고 그래프를 만들어 보면서 실제로 데이터를 어떻게 다루고 활용할 수 있는지 이해할 수 있다. 데이터 과학이 처음이라면 고민하지 말고 시작해 보자!
저자

드미트리지노비에프

저자드미트리지노비에프는모스크바국립대학교에서물리학석사학위를,스토니브룩대학교에서컴퓨터공학박사학위를취득했다.주요연구분야는컴퓨터시뮬레이션과모델링,네트워크과학,소셜네트워크분석,디지털인류학이다.2001년부터매사추세츠보스턴에위치한서퍽대학교에서학생들을가르치고있다.

목차

1장데이터과학이란?
UNIT01데이터분석과정
UNIT02데이터수집파이프라인
UNIT03보고서구조
해보자

2장데이터과학에서파이썬의핵심알기
UNIT04기본문자열함수이해하기
UNIT05올바른자료구조선택하기
UNIT06리스트내포로리스트이해하기
UNIT07카운터로세기
UNIT08파일다루기
UNIT09웹에접근하기
UNIT10정규표현식으로패턴매칭하기
UNIT11파일과기타스트링다루기
UNIT12pickle로데이터압축하기
해보자

3장텍스트데이터다루기
UNIT13HTML파일처리하기
UNIT14CSV파일다루기
UNIT15JSON파일읽기
UNIT16자연어처리하기
해보자

4장데이터베이스다루기
UNIT17MySQL데이터베이스설정하기
UNIT18MySQL사용하기:명령줄
UNIT19MySQL사용하기:pymysql
UNIT20문서다루기:MongoDB
해보자

5장테이블형수치데이터다루기
UNIT21배열만들기
UNIT22행열전환과형태변형하기
UNIT23인덱싱과자르기
UNIT24브로드캐스팅
UNIT25유니버셜함수파헤치기
UNIT26조건부함수이해하기
UNIT27배열집계와정렬하기
UNIT28배열을셋처럼다루기
UNIT29배열저장하고읽기
UNIT30합성사인파만들기
해보자

6장데이터시리즈와프레임다루기
UNIT31Pandas데이터구조에익숙해지기
UNIT32데이터모양바꾸기
UNIT33데이터누락다루기
UNIT34데이터합치기
UNIT35데이터정렬하기
UNIT36데이터변환하기
UNIT37Pandas파일입출력다루기
해보자

7장네트워크데이터다루기
UNIT38그래프분해하기
UNIT39네트워크분석순서
UNIT40NetworkX사용하기
해보자

8장플로팅하기
UNIT41pyplot으로기본플롯그리기
UNIT42다른플롯타입알아보기
UNIT43플롯꾸미기
UNIT44Pandas로플롯그리기
해보자

9장확률과통계
UNIT45확률분포다시보기
UNIT46통계방법론다시보기
UNIT47파이썬으로통계분석하기
해보자

10장머신러닝
UNIT48예측실험디자인하기
UNIT49회귀직선적합하기
UNIT50K-평균클러스터링으로데이터묶기
UNIT51랜덤포레스트에서살아남기
해보자

부록A더읽어보기
부록B별1개짜리연습문제해답보기
부록C실습환경설정하기
참고문헌

출판사 서평

누구나파이썬으로데이터를분석하고시각화할수있다!

UNIT1~12|데이터과학의개념과파이썬핵심배우기
데이터과학이무엇인지개념을알아보고,기본문자열함수,자료구조,카운터,리스트,정규표현식,pickle과같은데이터과학에서주로사용하는파이썬핵심도배웁니다.

UNIT13~40|다양한데이터다루기
HTML,CSV,JSON파일등의텍스트를BeautifulSoup,NLTK를사용해다루는방법,NumPy를사용해수치형데이터를처리하는방법,Pandas를사용해테이블형데이터를다루는방법,NetworkX를사용한네트워크분석을다룹니다.MySQL(관계형데이터베이스)과MongoDB(비관계형데이터베이스)와같은외부데이터베이스를사용하는방법도설명합니다.

UNIT41~51|데이터시각화와확률통계,머신러닝
pyplot,Pandas를사용해여러가지플롯을그리고꾸미는방법을설명합니다.예측분석,확률분포,파이썬통계분석,K-평균클러스터링으로데이터묶기,랜덤포레스트와같은색다른주제도간단히살펴봅니다.