빅데이터 분석 R 유 레디
Description
4차 산업 혁명 시대 관련 기술 중 하나인 빅데이터 관련 기술은 기존에는 오프라인 형태의 일부 데이터들을 활용한 반면 인터넷이 발달하면서 빅데이터를 활용한 기술이 기하급수적으로 증가하고 사회 전 분야에 걸쳐서 관심이 지속되고 있으며, 다양한 분야에 활용되고 있다.

빅데이터는 특정 분야가 아닌 인문, 사회, 경영, 경상, 공학, 자연과학, 의학, 치의학 분야 등 모든 분야에서 활용되고 있고, 수많은 데이터들 중에 의미 있는 정보를 추출해내는 핵심 기술로써 인식되고 있다.

이 책은 빅데이터를 처음 접하거나 초보자들을 위해 본문에서는 기본적인 내용들을 다루고 실습과정과 연습문제를 통해 분석 능력을 갖출 수 있도록 하였다.
저자

이광옥,조영주,임희경,유소월

조선대학교전산통계학이학박사
조선대학교교육학과교육학박사수료
現)조선대학교SW중심대학사업단학술연구교수

목차

CHAPTER1R의소개와설치001
1.1R이란무엇인가?003
1.2R과RStudio설치003
1.2.1R설치하기003
1.2.2RStudio설치하기010
1.3RStudio실행하기015
1.4기본프로젝트만들기016
1.5RStudio환경설정하기023

CHAPTER2데이터027
2.1데이터종류029
2.2변수와자료형029
2.2.1변수029
2.2.2자료형030
2.2.3자료형확인하기031
2.3입출력032
2.3.1입력032
2.3.2출력034
2.4데이터프레임035
■EXERCISE037

CHAPTER3함수와패키지039
3.1함수란무엇인가?041
3.2기본함수041
3.2.1c()함수041
3.2.2seq()함수042
3.3수학함수046
3.4문자함수050
3.5비교연산자053
3.6논리연산자054
3.7조건문055
3.7.1if~else함수055
3.7.2if~elseif함수058
3.7.3ifelse()함수059
3.7.4switch()함수062
3.8반복문063
3.8.1for()함수063
3.8.2while()함수068
3.9패키지075
■EXERCISE077

CHAPTER4데이터분석081
4.1데이터파악하기083
4.2변수명변경하기092
4.3파생변수생성하기094
■EXERCISE096

CHAPTER5데이터가공및분석099
5.1데이터추출하기101
5.2데이터정렬하기113
5.3데이터변형하기118
5.4데이터요약하기126
5.5데이터그룹화하기136
5.6데이터결합하기141
■EXERCISE145

CHAPTER6데이터정제147
6.1결측치확인149
6.1.1is.na()함수150
6.1.2table()함수151
6.1.3summary()함수153
6.1.4!is.na()함수155
6.1.5complete.cases()함수156
6.1.6na.omit()함수158
6.1.7filter()함수159
6.2결측치처리163
6.2.1na.rm=T함수163
6.2.2결측치를평균값으로변경167
6.3이상치확인및처리171
■EXERCISE177

CHAPTER7그래프179
7.1qplot()함수181
7.2hist()함수183
7.3plot()함수184
7.4pie()함수186
7.5boxplot()함수187
7.6ggplot2()패키지193
7.6.1geom_bar()함수193
7.6.2geom_point()함수197
7.6.3geom_line()함수202
7.6.4geom_boxplot()함수207
■EXERCISE210

CHAPTER8텍스트마이닝213
8.1단어의빈도분석하기215
8.1.1텍스트전처리215
8.1.2토큰화하기221
8.1.3단어빈도분석하기224
8.2형태소분석기를이용한단어빈도분석233
8.2.1형태소분석233
8.2.2명사빈도분석하기237

CHAPTER9Shapefile을활용한대한민국지도시각화241
9.1Shapefile을활용한대한민국지도시각화243
9.1.1shapefile불러오기246
9.1.2shapefile을데이터프레임으로변환252
9.1.3ggplot2패키지로지도시각화257
9.1.4행정구역의위치정보와메타데이터속성의결합258
9.2서울시지도시각화263
9.3서울시초미세먼지단계구분도267
9.3.1서울시초미세먼지데이터수집268
9.3.2초미세먼지데이터와시군구데이터를병합한통합데이터생성272
9.3.3서울시초미세먼지단계구분도276
9.3.4서울시초미세먼지인터렉티브단계구분도279

CHAPTER10대기오염측정데이터분석283

CHAPTER11전국일반음식점표준데이터를활용한실전분석295
11.1전국일반음식점표준데이터준비297
11.2전국일반음식점표준데이터파악299
11.3전국일반음식점표준데이터전처리302
11.4전국일반음식점표준데이터분석310
11.4.1전국일반음식점표준데이터전국통계310
11.4.2전국일반음식점표준데이터서울특별시통계317

INDEX327

출판사 서평

4차산업혁명시대에핵심이되는관련기술로는인공지능,3D프린팅,빅데이터,텔레매틱스,클라우드컴퓨팅,웨어러블,RFID,자율주행차,유비쿼터스컴퓨팅,사물인터넷등이있으며,4차사업혁명의본질은가상과현실의융합이다.4차산업시대에있어서소프트웨어는국가의경쟁력을좌우하게될것이며,선진국을중심으로코딩교육을실시하고있으며,우리나라에서도시대의흐름에따라소프
트웨어의중요성을인식하고초등학교에서부터정규교과로편성하여교육을하고있다.

4차산업혁명시대관련기술중하나인빅데이터관련기술은기존에는오프라인형태의일부데이터들을활용한반면인터넷이발달하면서빅데이터를활용한기술이기하급수적으로증가하고사회전분야에걸쳐서관심이지속되고있으며,다양한분야에활용되고있다.

빅데이터는특정분야가아닌인문,사회,경영,경상,공학,자연과학,의학,치의학분야등모든분야에서활용되고있고,수많은데이터들중에의미있는정보를추출해내는핵심기술로써인식되고있다.

이책은빅데이터를처음접하거나초보자들을위해본문에서는기본적인내용들을다루고실습과정과연습문제를통해분석능력을갖출수있도록하였다.