빅데이터 분석 R과 빅데이터 플랫폼 하둡 개론 (2 판)

빅데이터 분석 R과 빅데이터 플랫폼 하둡 개론 (2 판)

$39.82
Description
R은 기초통계, 회귀분석, 다변량분석, 비선형 모형, 비모수통계, 시계열분석, 군집분석, 공간통계 등 다양한 통계분석과 기계학습, 딥 러닝, 인공 신경망분석 등 인공지능 분야, 데이터 마이닝, 고객관계 분석, 마케팅 조사 및 분석, 비즈니스 분석, 재무분석 및 예측 등 경영분야 등 많은 분야의 분석 도구를 제공하고 있다. Hadoop은 실시간 데이터 처리를 위한 빅데이터 플랫폼으로 널리 사용되고 있다.
저자

류귀열

류귀열교수는서울대학교자연과학대학계산통계학과를졸업하고,서울대학교계산통계학과에서시계열분석으로박사학위를받고,3년간한국통신연구소에서재직하였다.현재서경대학교소프트웨어학과교수로재직중이다.

학위취득초기에는통신활성화를위한통신정책을연구하였다가,이후20여년동안은이와병행하여소프트웨어개발및지도에힘썼다.

최근에는빅데이터와딥러닝에올인하고있다.

목차

Chapter01R소개


1절서론

2절R설치하기

3절R언어기초

4절데이터구조

5절데이터입출력

6절공공데이터사이트데이터받기

연습문제


Chapter02데이터분석기초


1절RStudio사용법

2절기초적통계분석

3절기술통계2:정량적자료요약

연습문제


Chapter03데이터시각화


1절ggplot2패키지를이용하여그래프그리기

2절ggplot2환경설정

3절ggplot2를이용한산점도응용

4절ggplot2를이용한그래프그리기

연습문제


Chapter04확률입문


1절확률이란?

2절확률계산법칙

3절조건부확률

4절베이즈정리

5절이산확률분포

6절연속확률분포

연습문제


Chapter05추정및검정


1절표본분포

2절구간추정

3절가설검정

연습문제


Chapter06분산분석


1절두모집단평균차이(μ​1-μ​2)에대한추정:​σ​1과​σ​2를알고있을때

2절두모집단평균차이에대한추정과검정:대응표본

3절분산분석

연습문제


Chapter07선형회귀분석


1절단순선형회귀분석(simplelinearregressionanalysis)

2절잔차분석을통한타당성검정

3절중회귀분석(MultipleRegressionAnalysis)

4절중회귀모형에서변수선택방법

5절다중공선성문제(MulticolinearityProblem)

6절이상치(Outlier)제거

7절더미변수를이용한회귀분석

8절로지스틱회귀분석(LogisticRegression)

연습문제


Chapter08시계열분석


1절시계열패턴

2절수평패턴예측

3절추세패턴예측

4절계절패턴예측

5절추세와계절패턴

연습문제


Chapter09분류분석(ClassificationAnalysis)


1절의사결정나무(DecisionTree)

2절k-means분류

연습문제


Chapter10리눅스입문


1절리눅스(Linux)란?

2절리눅스설치:CentOS리눅스

3절리눅스의기본명령어

연습문제


Chapter11하둡


1절빅데이터란?

2절하둡의생태계

3절자바설치

4절하둡(Hadoop)설치

5절WordCount실습

6절완전분산모드설치

연습문제