데이터 사이언스 교과서

데이터 사이언스 교과서

$25.00
Description
파이썬으로 배우는
통계 분석·패턴 인식·딥러닝·신호 처리·시계열 데이터 분석!
데이터 사이언스 교과서
데이터 사이언스는 ‘데이터를 과학적으로 다루는’ 학문 분야로 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다. 또, 데이터를 채굴하듯이 수많은 데이터 가운데 유용한 정보를 추출해 내고 의사결정에 활용하는 데이터 마이닝(Data Mining)과 유사하게 다양한 형태의 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합 분야로 이해되기도 한다. 최근 정보통신 기술의 비약적 발전으로 유무선 인터넷을 통해 얻을 수 있는 데이터의 양이 폭발적으로 증가한 데다 컴퓨터/모바일 기기의 고성능화가 진전되어 지금까지 할 수 없던 빅데이터 처리가 가능해져 한층 더 주목받고 있다.

이 책을 통해 독자는 데이터 사이언스의 의미부터 금융 데이터 분석, 동적 시스템 분석 등의 공학 응용까지를 파이썬으로 실제로 분석하면서 학습할 수 있다. 특히 데이터 처리와 확률·통계 기초와 같은 기본적인 부분부터 회귀분석, 패턴 인식, 딥러닝 등 통계·머신러닝 기법, 금융 데이터 등 시시각각 변하는 시계열 데이터 분석, 센서 데이터 등에 포함된 노이즈나 외란을 판별하는 스펙트럼 분석, 노이즈나 외란을 제거하기 위한 디지털 필터, 이미지 데이터의 분석으로 이미지 처리를 설명함으로써 데이터 과학의 개략적 내용을 한눈에 파악할 수 있다. 무엇보다 파이썬을 예제로 한 설명으로 이론과 실습을 겸비하여 데이터 과학을 학습하여 제 분야에 응용하고 싶은 독자에게 안성맞춤이다.

대상 독자
ㆍ자신의 전문 분야, 공학·경제·인문사회계에서 데이터 과학을 응용하고 싶은 분
ㆍ센서 데이터 등의 시계열 데이터 분석을 수행하고 싶은 분
ㆍ파이썬으로 동적 시스템 분석 및 신호 처리·분석을 해보고 싶은 분

★ 예제 코드 다운로드! - ㈜성안당 홈페이지(www.cyber.co.kr)=회원가입-로그인 상태에서 [자료실]-[자료실 바로가기]-‘데이터사이언스’ [검색]-(도서 제목명 클릭)-[자료 다운로드 바로가기]
선정 및 수상내역
- 2021세종도서 학술 부문 우수 도서 선정
저자

하시모토히로시

1988년와세다대학교대학원이공학연구과박사과정
현재산업기술대학원대학창조기술연구과교수
공학박사(와세다대학교)

주요저서
ㆍ〈도해컴퓨터개론[하드웨어]〉(개정4판),옴사(2017),공저
ㆍ〈도해컴퓨터개론[소프트웨어·통신네트워크]〉(개정4판),옴사(2017),공저
ㆍ〈Scilab로배우는시스템제어의기초〉옴사(2007),공저
ㆍ〈전기회로교본〉옴사(2001),그외저서다수

목차

제1장서론

1.1데이터과학개요
1.1.1읽기전에
1.1.2데이터과학이란
1.1.3데이터과학의영역과역할
1.1.4데이터를보는안목을기른다
1.2파이썬과패키지
1.2.1파이썬(Pyhton)의도입
1.2.2이책에서이용하는패키지
1.3몇가지약속
1.3.1노트북(Notebook)과스크립트
1.3.2모듈이름의생략어
1.3.3파일명의생략
1.3.4패키지함수사용법의조사방법
1.4퀵스타트
1.4.1설치
1.4.2주피터노트북(JupyterNotebook)·스크립트의구현과실행방법
1.4.3프로그램과데이터를구하는방법
1.5파이썬을이용한한글처리
1.5.1스크립트에한글을기술한다
1.5.2한글을포함한데이터파일읽기
1.5.3matplotlib로한글을표시한다
1.6용어의차이
1.6.1설명변수/목적변수,입력/출력
1.6.2표본과데이터
1.6.3예측과추정
1.6.4클래스분류
1.6.5트레이닝데이터,테스트데이터
1.6.6오버피팅
1.6.7분석
1.6.8변수
1.6.9상관과공분산
1.7수학,수치계산,물리의시작
1.7.1수학의시작
1.7.2수치계산의문제
1.7.3물리의시작

제2장데이터처리와가시화
2.1데이터의종류
2.2데이터의취득
2.3데이터의저장
2.3.1numpy.ndarray
2.3.2pandas.DataFrame
2.3.3numpy.ndarray와pandas.DataFrame의변환
2.4그래프작성
2.4.1matplotlib.
2.4.2복수의그래프
2.4.3Titnic(타이타닉호)의pandas그래프그리기
2.4.4Iris(아이리스)의seaborn그래프.
2.4.5Iris데이터

제3장확률의기초
3.1확률이란
3.2기본적인용어의설명
3.2.1이산확률변수
3.2.2연속확률변수
3.2.3확률밀도함수,확률질량함수와백분위점55
3.2.4모집단과표본
3.2.5평균,분산,그외의양.
3.2.6이산형의기댓값과평균.
3.3정규분포
3.3.1정규분포의표현
3.3.2확률변수의생성
3.3.3중심극한정리
3.4포아송분포
3.4.1포아송분포의표현
3.4.2포아송분포의예
3,4,3포아송도착모델의시뮬레이션
3.4.4역함수를이용한난수생성.
3.5확률분포와패키지함수
3.5.1베르누이분포(Bernoullidistribution)
3.5.2이항분포(binomialdistribution)
3.5.3포아송분포(Poissondistribution)
3.5.4카이제곱분포(chi-squareddistribution)
3.5.5지수분포(exponentialdistribution)
3.5.6분포(distribution)
3.5.7정규분포(normaldistribution)
3.5.8분포(distribution)
3.5.9균일분포(uniformdistribution)

제4장통계의기초
4.1통계란
4.2추정.
4.2.1점추정
4.2.2구간추정
4.2.3모평균의신뢰구간
4.2.4모비율의신뢰구간
4.3가설검정
4.3.1가설검정이란
4.3.1단측검정과양측검정
4.3.3모평균의검정
4.3.4모분산의검정
4.3.5두표본의평균차이에대한검정
4.3.6상관,무상관의검정

제5장회귀분석
5.1회귀분석이란
5.1.1회귀의유래
5.1.2시스템이론에서본회귀분석
5.1.3statsmodels
5.2단순회귀분석
5.2.1단순회귀분석의의의
5.2.2단순회귀모델의통계적평가
5.2.3가계동향조사
5.2.4심슨의역설
5.2.5수학적설명
5.3다항식회귀분석
5.3.1다항식모델
5.3.2R데이터세트cars
5.4중회귀분석
5.4.1검정
5.4.2다중공선성
5.4.3전력과기온의관계
5.4.4와인의품질분석
5.4.5수학적설명
5.5일반화선형모델
5.5.1일반화선형모델의개요
5.5.2포아송회귀모델
5.5.3z=β0의예
5.5.4z=β0+β0χ1의예
5.5.5로지스틱회귀모델
5.5.6수학적설명

제6장패턴인식
6.1패턴인식의개요
6.1.1패턴인식이란
6.1.2클래스분류의성능평가
6.1.3홀드아웃과교차검증
6.1.4이장에서다루는패턴인식방법

6.2서포트벡터머신(SVM)
6.2.1클래스분류와마진의최대화
6.2.2비선형분리의아이디어
6.2.3선형,원형데이터의하드마진
6.2.4소프트웨어마진과홀드아웃
6.2.5교차검증과그리드서치
6.2.6멀티클래스분류
6.3SVM의수학적설명
6.3.1마진최대화
6.3.2커널함수의이용
6.3.3소프트마진
6.4최근접이웃법(κNN)
6.4.1알고리즘의논리
6.4.2κNN의기본적사용법
6.4.3Iris데이터
6.4.4sklearn이제공하는거리
6.5평균법
6.5.1알고리즘의논리
6.5.2make_blobs를이용한클러스터링
6.5.3도매업자의고객데이터
6.5.4수학적설명
6.6응집형계층클러스터링
6.6.1알고리즘의논리
6.6.2덴드로그램
6.6.3도야마현의시읍면별인구동태

제7장심층학습
7.1심층학습의개요와종류
7.1.1심층학습이란
7.1.2심층학습의활용예
7.1.3용어의설명
7.2Chainer
7.2.1개요와설치
7.2.2.실행과평가
7.2.3κNN용스크립트의설명
7.3NN(신경망)
7.3.1개요와계산방법
7.3.2κNN스크립트의변경
7.4DNN(심층신경망)
7.4.1개요와실행
7.4.2파일데이터의처리방법
7.5CNN(합성곱신경망)
7.5.1개요와계산방법
7.5.2학습과검증
7.5.3트레이닝데이터의작성법
7.6QL(Q학습)
7.6.1개요와계산방법
7.6.2실행방법
7.6.3병따기게임
7.7DQN(심층Q네트워크)
7.7.1개요
7.7.2실행방법
7.7.3병따기게임

제8장시계열데이터분석
8.1동적시스템
8.1.1인과성과동적시스템
8.1.2동적시스템의선형모델
8.1.31차시스템의시간응답
8.1.42차시스템의시간응답
8.2이산시간계
8.2.1이산화
8.2.2샘플링시간의선정
8.2.3이산시간계의차분형식의해석
8.2.4지연연산자
8.2.5이산시간모델도입의문제설정
8.3ARMA모델
8.3.1ARMA모델의표현
8.3.2가식별성과PE성의조건
8.3.3입력신호후보와항의문제
8.3.4ARMA모델의안전성과성질
8.3.5파라미터추정
8.4모델의평가
8.4.1모델차수의선정과AIC
8.4.2모델차수의선정과극·영점소거법
8.4.3잔차계열의검정
8.5ARMA모델을이용한예측
8.5.1예측방법
8.6ARIMA모델
8.6.1트렌드
8.6.2ARIMA모델의표현
8.6.3트렌드를가진시계열데이터분석
8.7SARIMAX모델
8.7.1항공사의승객수
8.7.2그외의계절성데이터
8.8주가데이터의시계열분석
8.8.1이동평균
8.8.2볼린저밴드
8.8.3캔들차트

제9장스펙트럼분석
9.1기본사항
9.1.1주파수란소리를내는것
9.1.2스펙트럼이란
9.2푸리에변환
9.2.1푸리에변환과푸리에역변환
9.2.2진폭,에너지,파워스펙트럼
9.3현실의문제점
9.3.1샘플링문제
9.3.2엘리어싱
9.3.3유한장파형의문제점
9.4이산푸리에변환(DFT)
9.4.1DFT의표현
9.4.2사인파의DFT예
9.4.3제로패딩
9.5윈도우함수
9.5.1윈도우함수의종류
9.5.2윈도우함수의사용예
9.5.3수학적표현
9.6랜덤신호의파워스펙트럼밀도
9.6.1파워스펙트럼밀도의표현
9.9.2PSD는확률변수

제10장디지털필터
10.1필터의개요
10.1.1필터란
10.1.2필터특성
10.1.3데시벨[dB]
10.2아날로그필터의설계
10.2.1버터워스필터
10.2.2체비셰프필터
10.3디지털필터의설계
10.3.1디지털필터의도입
10.3.2디지털필터의구조
10.3.3FIR필터
10.3.4IIR필터
10.3.5정규화각주파수
10.4FIR필터의설계
10.4.1윈도우함수를이용한설계방법
10.4.2설계예
10.5IIR필터의설계
10.5.1아날로그필터에기초한방법
10.5.2설계예

제11장이미지처리
11.1이미지처리의개요
11.1.1색좌표계
11.1.2수치로서의표현
11.1.3표본화와양자화
11.1.4이미지데이터입수하기
11.1.5OpenCV의문서
11.1.6실행방법
11.2이미지처리의예
11.2.12진화
11.2.2에지검출
11.2.3주파수필터링
11.2.4특징점추출
11.3기타
11.3.1카메라에서이미지불러오기
11.3.2광학흐름
11.3.3얼굴인식

참고문헌
맺음말
색인