데이터 사이언스 입문 A to Z

데이터 사이언스 입문 A to Z

$29.00
Description
이 책은 데이터 분석을 위한 기본서 라고 할 수 있다.

데이터사이언스 입문 A to Z은 4차 산업혁명에서 꼭 필요한 데이터분석에 대한 내용을 다룬 교재다. 사회적으로 데이터를 분석하는 전문가에 대한 수요는 급증하고 있는데 이 분야에 뛰어난 분석력과 창의적인 인재가 부족한 것이 현실이다.
이 책은 데이터전문가를 양성하는데 있어서 꼭 필요한 내용으로 역어져 있으며 데이터전문가로 성장하는데 필요한 기초적인 모든 내용을 포괄적으로 다루고 있다.
파이썬의 수학 라이브러리인 numpy를 비롯하여 데이터 통계 라이브러리인 pandas와 matplotlib 등에 관한 설명과 예제들이 가득한 책이며 금융 데이터 분석, 공공데이터 분석 등을 처리하는 예제들을 통한 데이터 분석 활용법을 알려주는 책이다.

4차 산업혁명에서 매우 중요한 위치를 차지하고 있는 데이터 사이언스와 머신 러닝이 일반화된 지금, 다양한 머신 러닝과 딥 러닝을 데이터에 적용하는 것은 그리 어렵지 않은 일이 됐다. 데이터 사이언스에서 가장 중요한 것은 데이터 그 자체다. 하지만 데이터 처리 기술에만 집중하고 있다.

IT 현장에서 데이터 수집 과정에서 수많은 오류를 포함하게 되는 경우를 자주 본다. 따라서 데이터 전처리(Data pre-processing)는 데이터 사이언스에서 매우 중요한 과정이다.

특히, 빅 데이터를 다루는 많은 사람들에게 있어 데이터 자체가 지니고 있는 오류를 발견하고 보정해주고, 추후에 모델이 수립될 경우 그 의미와 해석에 대해서 서로 연결 시켜나갈 수 있는 로우 데이터(Raw Data)를 들여다 볼 수 있는 실력은 정말 중요하다.

바로 이 책은 그런 부분을 중점적으로 집필했다.
저자

문용준

은행,SI기업,컨설팅회사등20년넘게여러회사를다녔다.금융기관관련ISP,EA및차세대프로젝트에서주로비즈니스나애플리케이션아키텍처를설계했고,프로젝트에서데이터모델링,객체모델링,서비스모델링과아키텍트역할을했다.요즘주관심분야는금융권에적용하는핀테크,빅데이터,인공지능이며아마도평생파이썬을하면서살것같다.저서로는<손에잡히는파이썬>이있다.

목차

Chapter01개발환경설치
1.아나콘다설치
2.주피터노트북실행
3.주피터노트북사용하기
4.파이썬모듈

Chapter02파이썬기본
1.파이썬변수와기본문장
2.파이썬함수
3.파이썬클래스와객체
4.파이썬내장숫자클래스
5.문자열

Chapter03배열데이터
1.파이썬리스트클래스
2.배열(array)모듈의배열
3.넘파이모듈의다차원배열

Chapter04판다스의자료구조
1.시리즈(Series)클래스
2.데이터프레임(DataFrame)구조
3.시리즈와데이터프레임의자료형관리기준


Chapter05데이터구조접근하기
1.다차원배열팬시검색과논리검색
2.판다스의팬시검색과논리검색
3.데이터구조변경

Chapter06시각화
1.그래프의기본
2.그래프꾸미기
3.다른시각화모듈

Chapter07수학함수
1.시그마와파이기호
2.지수,로그와삼각함수
3.축기준으로함수처리


Chapter08확률의기초와원리
1.집합
2.경우의수
3.확률의원리
4.확률변수와확률분포
5.베이지안

Chapter09선형대수로넘파이모듈이해하기
1.벡터와1차원배열
2.행렬과2차원배열
3.텐서와다차원배열
4.유니버설함수(universalfunction)
5.선형대수연산인내적과외적
6.행렬식과역행렬
7.선형변환,고윳값,고유벡터

Chapter10신경망사용함수
1.활성화함수(activationfunction)
2.미분
3.계층(layer)을다차원배열로계산하기
4.합성곱함수

Chapter11데이터변수정제
1.날짜자료형
2.결측값및이상치값처리
3.다양한값의정규화와변환

Chapter12데이터로통계알아보기
1.중심위치확인
2.퍼진정도확인

Chapter13공공데이터
1.공공데이터분석
2.유가데이터분석

Chapter14금융데이터
1.주식데이터분석
2.환율,지수등금융데이터분석
3.한국의주식시가총액분석

Chapter15자연어기본
1.자연어기본처리
2.HTML파싱과워드크라우드

출판사 서평

이책의특징
꼭필요한내용을하나로연결
가장기본적인처리를기준으로꼭필요한것을하나로연결해서더쉽게접근할수있도록묶었습니다.
넘파이와판다스모듈이해와선형대수처리방식
데이터를분석하려면숫자를관리하는배열형태의자료구조를알아야합니다.넘파이와판다스모듈의배열개념을이해하고,배열내의원소를계산하는선형대수처리방식을알아봅니다.
머신러닝과딥러닝
머신러닝과딥러닝의알고리즘을잘사용하는것도중요하지만데이터가왜이런결과로만들어졌는지정확히파악하는것도중요하므로그원리를알아봅니다.
각종데이터분석에서부터자연어의기본까지데이터사이언스에서필요한대부분의내용들을다루고있습니다.