R을 이용한 시각화와 데이터 분석 개론

R을 이용한 시각화와 데이터 분석 개론

$33.30
Description
본 서의 특징은 다음과 같다.

첫째, 1장에서 기초적인 R 프로그래밍과 데이터를 다양한 방법으로 입력받는 기능들을 공부한 다. 특히 실제 데이터를 웹 등에서 크롤링하여 입력받는 방법도 공부한다.
둘째, R의 장점 중의 하나인 데이터를 효과적으로 보여주기 위한 시각화에 대한 설명이 있다.
이를 기반으로 데이터분석의 결과를 시각화할 수 있을 것이며 또한 시각화를 위한 제3자 개발자 의 소프트웨어도 이해할 수 있을 것으로 예상한다.
셋째, 기초통계학 분야를 100% R로 구현하였다. 실제 데이터로 실습함으로써 학습효과를 높 일 수 있을 것으로 기대된다.
넷째, 본서는 기초적인 분석방법에만 국한하지 않고 데이터분석의 핵심적인 응용분야인 회귀 분석을 자세히 설명되어 있다. 또한 실제 데이터를 다양한 방법으로 분석함으로써 분석에 대한 다양한 시각을 가질 수 있을 것이다.
다섯째, 빅데이터 시대에는 자료의 실시간 분석 및 예측이 많이 사용된다. 본 서는 통계학에서 사용되는 예측방법론인 시계열분석을 포함하고 있다. 본 서를 공부하면 기초적인 예측방법론을 이해하고 적용할 수 있을 것이다.
여섯째, 딥러닝의 기초인 분류분석도 포함되어 있다. 본 서를 공부하면 인공지능 분야에서 많이 사용되는 딥러닝 공부에도 많은 도움이 될 것이다.
저자

류귀열

류귀열교수는서울대학교자연과학대학계산통계학과를졸업하고,서울대학교계산통계학과에서시계열분석으로박사학위를받고,3년간한국통신연구소에서재직하였다.현재서경대학교소프트웨어학과교수로재직중이다.

학위취득초기에는통신활성화를위한통신정책을연구하였다가,이후20여년동안은이와병행하여소프트웨어개발및지도에힘썼다.

최근에는빅데이터시스템구축및개발에올인하고있다.

목차

Chapter01R소개

1서론
2R설치하기
3R언어기초
4데이터구조
5데이터입출력
6공공데이터사이트데이터받기

Chapter02데이터분석기초

1RStudio사용법
2기초적통계분석
3기술통계2:정량적자료요약

Chapter03데이터시각화

1ggplot2패키지를이용하여그래프그리기

2ggplot2환경설정
3ggplot2를이용한산점도응용
4ggplot2를이용한그래프그리기

Chapter04확률입문

1확률이란?

2확률계산법칙

3조건부확률

4베이즈정리

5이산확률분포
6연속확률분포

Chapter05추정및검정

1표본분포

2구간추정

3가설검정

Chapter06분산분석

1두모집단평균차이(μ?1-μ?2)에대한추정:?σ?1과?σ?2를알고있을때
2두모집단평균차이에대한추정과검정:대응표본

3분산분석

Chapter07선형회귀분석

1단순선형회귀분석(simplelinearregressionanalysis)

2잔차분석을통한타당성검정
3중회귀분석(MultipleRegressionAnalysis)
4중회귀모형에서변수선택방법
5다중공선성문제(MulticolinearityProblem)
6이상치(Outlier)제거
7더미변수를이용한회귀분석
8로지스틱회귀분석(LogisticRegression)

Chapter08시계열분석

1시계열패턴

2수평패턴예측

3추세패턴예측

4계절패턴예측

5추세와계절패턴

Chapter09분류분석(ClassificationAnalysis)

1의사결정나무(DecisionTree)

2k-means분류