처음 시작하는 R 데이터 분석
Description
R 프로그램을 처음 시작하는 초보자를 위한 최적의 입문서!
이 책은 R/Rstudio 프로그램의 설치와 실행부터 Rstudio를 이용한 전처리 과정, 시각화, 시각화를 통한 통계 분석 등 데이터 분석에 필요한 다양한 기본기를 다루었습니다. 각 장에서 배워야 할 중요 개념들을 먼저 다룬 후 해당 기능에 대한 예제를 이용하여 충분한 연습을 할 수 있습니다. 또한 실제 예제를 이용하여 데이터 분석과 통계 분석에 필요한 다양한 작업을 해봄으로써 지금까지 배운 내용을 종합적으로 학습할 수 있도록 하였습니다.
저자

김은옥

현재프로브미디어대표로국가인재개발원,서울시인재개발원,한국지역정보개발원등의주요공무원교육원에서빅데이터분석,인공지능,파이썬,Java및JSP프로그래밍강사로활동하고있습니다.주요저서로는〈기초부터활용까지실전으로배우는Ajax웹프로그래밍〉,〈막힘없이배우는JavaProgramming〉,〈은노기의JSP웹프로그래밍입문〉,〈안드로이드프로그래밍〉,〈쉽게배우는HTML5&CSS3그리고jQuary〉,〈쉽게배우는파이썬〉등이있습니다.

목차

머리말

CHAPTER01데이터분석개요
①데이터분석의의미와활용
②데이터분석에필요한것
(1)데이터분석에필요한3요소
(2)데이터분석과제수행순서
(3)데이터분석단계

CHAPTER02데이터분석툴R/RStudio설치및환경설정
①R의다운로드및설치
(1)선수작업
(2)R다운로드
(3)R설치
(4)R아이콘에관리자권한설정

②RStudio의다운로드및설치
(1)RStudio다운로드
(2)RStudio설치
(3)RStudio바로가기아이콘만들기
(4)RStudio실행시관리자권한설정

③RStudio의실행및설정
(1)RStudio실행
(2)패키지업데이트
(3)RStudio창의구성
(4)RStudio개발환경설정

④프로젝트작성과스크립트사용
(1)프로젝트관리폴더작성
(2)프로젝트작성
(3)프로젝트에작업폴더작성
(4)스크립트작성
(5)[Rscript]창에서코드실행방법

⑤R의도움말사용및패키지추가설치
(1)R의도움말사용법
(2)패키지관리:[Package]탭
(3)R에서제공하는모든패키지목록확인
(4)프로젝트에서필요한패키지설치및사용
ㆍ하나더

CHAPTER03R기본문법
①변수
(1)변수개요
(2)변수선언
(3)변수사용
(4)변수제거

②데이터타입
(1)데이터타입개요
(2)타입확인
(3)타입변환함수
(4)타입검사함수

③벡터
(1)벡터를만드는방법
(2)벡터원소값추출

④여러개의값저장
(1)벡터:c()
(2)리스트:list()
(3)행렬:matrix()
(4)배열:array()

⑤데이터프레임:data.frame()
(1)데이터프레임직접생성
(2)데이터파일을로드하여데이터프레임생성
⑥함수이해
(1)함수개요
(2)사용자정의함수
ㆍ하나더

CHAPTER04통계기초
①개요
(1)기술통계
(2)추리통계

②대표값과기초개념
(1)평균값,분산,표준편차
(2)최빈수(mode)
(3)R에서평균,분산,표준편차,최빈수구하기
(4)요약통계량
(5)R에서최소값,최대값,사분위수구하기

CHAPTER05탐색적데이터분석(EDA)개요-데이터분석1단계
①실무데이터를사용한작업순서
(1)실무데이터를읽어옴
(2)읽어온데이터처리:전처리
(3)전처리된데이터를통계분석하거나시각화

②모든데이터에공통으로해야할분석:EDA
(1)수량형변수와범주형변수
(2)데이터의내용과구조파악-기본함수또는dplyr패키지의함수사용
(3)데이터의요약통계량,빈도표파악
(4)결측치확인-결측치/이상치처리
(5)무조건시각화함-plot(),ggplot(),pairs()를사용

③수량형변수분석에서추가로해야할작업
(1)데이터정규성검사
(2)가설검정과신뢰구간
(3)이상점찾기

④범주형변수분석에서추가로해야할작업-성공과실패형
(1)요약통계량계산
(2)데이터분포시각화
(3)가설검정과신뢰구간

CHAPTER06데이터전처리-가공/처리
①데이터탐색함수
(1)데이터탐색에사용할데이터프레임생성
(2)head()함수
(3)tail()함수
(4)dim()함수
(5)str()함수
(6)summary()함수
(7)data.frame()함수
(8)name()함수

②데이터전처리를하는dplyr패키지의함수사용개요
(1)dplyr패키지설치및로드
(2)dplyr패키지의함수사용법
(3)%>%(파이프연산자)

③filter()함수-행(데이터)추출
(1)기본사용방법
(2)조건지정

④select()함수-열(변수)추출
(1)기본사용방법
(2)데이터프레임에서변수를추출하는다양한방법
(3)전처리함수중첩

⑤arrange()함수-정렬
(1)기본사용방법
(2)다차정렬
(3)사용자정의정렬
⑥mutate()함수-변수(필드)추가
(1)df_gap데이터프레임생성
(2)기본사용방법
(3)새변수만드는방법
(4)추가실습
(5)6장문제

⑦summarize()함수-요약통계치산출
(1)기본사용방법

⑧group_by()함수-그룹별로나누기
(1)기본사용방법

⑨left_join()함수-조인
(1)기본사용방법
(2)추가실습

⑩bind_rows()함수-바인딩
(1)기본사용방법

⑪랜덤샘플링함수
(1)sample_n()함수
(2)sample_frac()함수
⑫distinct()함수

CHAPTER07결측치와이상치처리
①결측치처리
(1)결측치확인함수
(2)결측치제외
(3)결측지보정

②이상치처리
(1)이상치를결측치로바꿔서제외
(2)이상치보정

CHAPTER08시각화
①시각화개요
(1)산점도행렬
(2)플롯파일로저장
(3)요약통계량과상관관계
(4)시각화순서

②ggplot()함수를사용한그래프작성기본
(1)작성방법
(2)그래프종류별작도

③변수의개수와종류별시각화
(1)수량형변수1개:x축
(2)범주형변수1개:x축
(3)수량형변수2개:x축,y축
(4)변수2개(x축날짜데이터,y축값)
(5)범주형변수1개,수량형변수1개:x축,y축
(6)추가실습
ㆍ단원문제

CHAPTER09통계적데이터분석개요-데이터분석2단계
①실무데이터를사용한전체데이터분석순서
(1)실무데이터로드
(2)탐색적데이터분석
(3)통계적데이터분석

CHAPTER10통계분석에필요한기본개념
①가설검정과p값,신뢰구간
(1)가설검정과p값
(2)대응표본t-test:코로나19사태전과후의지하철이용객수차이
(3)독립표본t-test:전륜구동차(f)와4륜구동차(4)간의도시주행연비(cty)차이
(4)단일표본t-test:지하철2호선의역별,일별하차승객수와지하철평균역별,일별하차승객수비교

②모집단,모수,표본

CHAPTER11데이터타입에따른분석기법
①개요
(1)모든데이터에공통으로해야할분석기법:탐색적데이터분석(EDA)
(2)변수종류와수에따른통계분석

②1개의수량형변수분석:t-test
(1)데이터로드및파악
(2)작업대상변수선택및통계량확인
(3)데이터형태파악을위한시각화
(4)일변량t-test
(5)이상치와로버스트통계방법

③1개의범주형변수분석:성공/실패값
(1)데이터로드및파악
(2)작업대상변수선택및빈도표확인
(3)데이터형태파악을위한시각화
(4)이항검정(binomialtest)binom.test()
(5)오차한계,표본크기

④2개의변수(수량형변수-x,수량형변수-y)분석:회귀분석
(1)데이터로드및파악
(2)요약통계량,결측치확인
(3)데이터형태파악을위한시각화
(4)상관계수
(5)단순회귀분석-lm(y~x)
(6)모형적합도검정
(7)선형회귀모형예측
(8)선형회귀모형의가정진단
(9)로버스트선형회귀분석-lqs()
(10)비선형(비모수적)회귀분석방법-평활법:LOESS

⑤2개의변수(범주형변수-x,수량형변수-y)분석:분산분석
(1)데이터로드및파악
(2)통계량,빈도표확인
(3)데이터형태파악을위한시각화
(4)분산분석-lm(y~x)
(5)분산분석진단플롯
ㆍ단원문제

CHAPTER12데이터타입에따른분석기법
①대한민국인구변화분석
(1)개요
(2)대한민국50년간의인구예측데이터를사용한인구변화확인
(3)혼인건수의변화와출생건수변화관계분석
②연령대별가구의재정변화분석
(1)개요
(2)연도별자산,부채의변화추이파악및예측
(3)연도별자산,소득현황비교
(4)연령대별재산의건전성및소득추이비교
ㆍ하나더

출판사 서평

R프로그램을처음시작하는분들을단시간에R전문가로이끌어드립니다.

[이책의특징]
누구나쉽게배울수있는R프로그램입문서

이책은R프로그램입문자들을위한책으로처음배우는입문자들이반드시익혀야하는필수기술들을중심으로작성되었습니다.

[이책의구성]
-이장의핵심:각장의핵심사항을개괄적으로설명
-예제:문법설명을이해하기위한간단한예제
-여기서잠깐:내용이나문제에도움이될만한추가내용
-추가실습:예제를확장한실습예제(CHAPTER06,CHAPTER08)
-단원문제:예제또는추가실습의응용으로주어진문제를직접해결하는문제(CHAPTER08,CHAPTER11)

[각CHAPTER의학습개요]
CHAPTER01데이터분석개요
데이터분석의정의,데이터분석의기능,데이터분석을위해알아야할사항

CHAPTER02데이터분석툴R/RStudio설치및환경설정
R기반에서데이터를분석하기위한프로그램설치와개발환경설정

CHAPTER03R기본문법
R을사용한데이터분석에필요한가장기본적인R문법인변수,데이터타입,데이터로드,함수선언

CHAPTER04통계기초
기본적인통계개념인대표값,요약통계량에사용되는값,기초개념학습

CHAPTER05탐색적데이터분석(EDA)개요-데이터분석1단계
전체데이터분석중탐색적데이터분석을하는순서에대한학습

CHAPTER06데이터전처리-가공/처리
데이터추출,필터,정렬,변수(필드)생성,그룹화등의전처리함수를사용한데이터전처리

CHAPTER07결측치와이상치처리
분석에사용할수없거나예측시잘못된결과를가져오는결측치와이상치의처리방법

CHAPTER08시각화
데이터의분포나형태를알수있어서데이터를한층더잘이해하게시각화하는방법

CHAPTER09통계적데이터분석개요-데이터분석2단계
통계적데이터분석을하는순서와각단계별개괄적인내용학습

CHAPTER10통계분석에필요한기본개념
통계의개념들이의외로매우적고간단한개념을이해함으로써해결하기위해통계분석에필요한필수적이고기본적인개념학습

CHAPTER11데이터타입에따른분석기법
변수종류나수에따라분석하는방법과필수적으로고려해야하는것들에대한학습

CHAPTER12데이터분석프로젝트
지금까지학습한데이터분석을익히기위해데이터분석으로부터이면의사실을파악하고,그이면의사실이의미하는것을이해함으로써사고를종합하고이해하는능력을익히는프로젝트학습