R코딩 플러스 (빅데이터 분석의 첫걸음)

R코딩 플러스 (빅데이터 분석의 첫걸음)

$35.99
Description
4차 산업혁명으로 들면서 2016년 바둑 경기에서 컴퓨터가 이세돌을 이긴 사건은 인공지능이 세상의 주목을 다시 받는 계기가 되었다. 최근 OpenAI의 chatGPT는 인간과의 대화 문맥을 이해하고 논리적인 글을 만들어낼 정도로 더 진화하였고, DALL-E는 문자 또는 이미지로 새로운 그림을 만들어내고 있다. 이처럼 인공지능은 하루가 다르게 발전하면서 인간의 창의적인 영역까지 두각을 나타내고 있어, 앞으로 인공지능의 도움으로 우리의 생활이 더욱 풍요로워질 것으로 기대되고 있다.
인공지능은 여러 가지 기법으로 구현 가능하다. chatGPT와 DALL-E 같이 데이터를 기반으로 하는 인공지능 기법들이 크게 활용 가치를 발휘하는 가운데, 인공지능을 이해하고 구현하거나 데이터를 읽고 분석하는 데이터 리터러시 능력은 주요 경쟁력의 하나가 되고 있다.
인공지능을 구현하는 여러 도구들이 있지만, R은 우리에게 새로운 기회가 될 수 있다. 통계 패키지로 출발한 R은 SAS, MATLAB, SPSS보다 더 선호되고 있으며, 범용 프로그래밍 언어인 Java, C/C++, Python 못지 않게 인기가 높다. R은 일반적인 데이터 처리를 위한 뛰어난 기능이 있고, 간단한 코딩으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 내며, 웹을 통한 정보 추출과 인공지능 구현을 위한 손쉬운 기능 등을 제공하고 있어 배울수록 흥미가 커질 것이다.
이 책은 R을 통해 데이터 활용에 대한 흥미와 코딩에 대한 자신감을 높이는 계기가 되었으면 하는 기대로, 이전의 R로 배우는 코딩 시리즈를 최신 환경의 변화에 따라 전면 개편한 것이다. 특히, 처음 데이터를 다루는 입문자를 위해 R의 기초 문법과 여러 흥미로운 주제를 쉽게 이해할 수 있도록 내용을 구성하였다.
저자

장용식,최진호

서강대학교이학사,POSTECH대학원물리학석사,KAIST에서경영공학박사학위를취득하였고,현재한신대학교IT경영학과교수로재직중이다.POSCO그룹에서MIS연구및개발경험이있으며,지능정보분야의다수국내외연구논문을발표하였고,안드로이드앱,JSP웹,R과파이썬기반데이터분석관련저서를출판하였다.

목차

PART1R의시작
CHAPTER1데이터활용과R
1.1제4차산업혁명과인공지능
1.2빅데이터의활용과데이터리터러시
1.3데이터분석도구:R

CHAPTER2R의시작
2.1R개발환경
2.2R설치와시작
2.3RStudio설치와시작
2.4R패키지

CHAPTER3데이터구조
3.1데이터구조의이해
3.2벡터와연산자
3.3요인
3.4배열과행렬
3.5리스트
3.6데이터프레임
연습문제

PART2시각화
CHAPTER4그래프
4.1그래프의활용과유형
4.2막대그래프
4.3선그래프
4.4산포도
4.5원그래프
4.6히스토그램
4.7박스플롯
연습문제
응용문제1:CDNow의거래데이터분포분석
응용문제2:강의길이에대한분포분석
CHAPTER5애니메이션
5.1애니메이션개요
5.2그래프애니메이션:막대그래프
5.3그래프애니메이션:산포도
5.4그래프애니메이션:선그래프
5.5그래프애니메이션:시계열데이터
5.6그림애니메이션:양궁
연습문제
응용문제1:애니메이션그래프
응용문제2:포물선으로날아가는화살
응용문제3:당구공굴리기

CHAPTER6지도
6.1지도개요
6.2지형정보지도
6.3지형정보지도를이용한지진분포파악
6.4우리나라행정경계지도
6.5행정경계지도를이용한국내지진분포파악
연습문제
응용문제1:지역별미세먼지분포
응용문제2:지역별코로나확진자수분포

PART3데이터수집과전처리
CHAPTER7웹스크래핑
7.1웹스크래핑개요
7.2DOM의이해
7.3웹스크래핑의기본원리
7.4웹스크래핑응용
연습문제
응용문제1:지역별미세먼지추출
응용문제2:지역별코로나확진자수추출

CHAPTER8공공데이터활용
8.1공공데이터포탈개요
8.2오픈API인증키신청:미세먼지정보
8.3미세먼지농도의시간대별그래프비교
8.4지역별미세먼지농도의지도분포
연습문제
응용문제:일별미세먼지발생현황조회

CHAPTER9네이버오픈API
9.1네이버오픈API개요
9.2네이버오픈API기본사항
9.3네이버정보검색API키발급받기
9.4뉴스검색및데이터정제
연습문제
응용문제:블로그검색

CHAPTER10데이터전처리
10.1데이터전처리개요
10.2데이터프로파일링
10.3데이터정제
10.4데이터통합
연습문제
응용문제1:adult데이터세트의프로파일링
응용문제2:시뮬레이션데이터의정제

PART4시뮬레이션과데이터분석
CHAPTER11시뮬레이션
11.1시뮬레이션개요
11.2표본추출과난수
11.3동전던지기
11.4원주율구하기
11.5회귀선구하기
연습문제
응용문제1:동전2개던지기
응용문제2:시행횟수에따른원주율의변화
응용문제3:회귀선구하기

CHAPTER12네트워크분석
12.1네트워크분석의개요
12.2네트워크분석지표
12.3네트워크유형별지표분석
12.4페이스북사용자의네트워크분석
연습문제
응용문제1:천체물리학자의협업네트워크분석
응용문제2:이메일네트워크분석

CHAPTER13인공신경망과딥러닝의이해
13.1인공지능과인공신경망개요
13.2인공신경망의기본원리
13.3선형회귀분석의예
13.4비선형회귀분석의예
연습문제
응용문제1:시뮬레이션데이터를이용한선형회귀분석
응용문제2:시뮬레이션데이터를이용한비선형회귀분석

부록
부록1:R과RStudio설치(2장참조)
부록2:graphics패키지를이용한그래프(4장참조)
부록3:네트워크분석(12장참조)
부록4:인공신경망을이용한분류문제(13장참조)

출판사 서평

이책의내용과학습절차

이책은크게R의시작-시각화-데이터수집과전처리-시뮬레이션과데이터분석의4개파트로구성되어있다.첫번째파트인R의시작에서는1장에서4차산업혁명시대의데이터분석사례를통해그중요성을이해하고,데이터분석도구인R의개요를살펴보자.2장에서는R과RStudio개발환경을구축하고시작하는과정을,3장에서는R데이터구조와데이터세트,그리고함수를통해기초적인문법을익혀보자.두번째파트인시각화파트는데이터분석효과를높이기위해그래프,애니메이션,지도출력방법을알아보자.4장에서ggplot2패키지를이용한고급그래프를출력하는방법을살펴보고,5장에서는그래프애니메이션과이미지애니메이션을제작해본다.6장에서는세계지도와우리나라행정지도를이용한지도의활용방법을살펴본다.세번째파트는데이터분석에필요한데이터수집과전처리과정을익히고,7장~9장에서웹스크래핑,공공데이터와네이버의OpenAPI를이용한실용적인데이터를수집하는방법을살펴보자.또한,10장에서데이터프로파일링,데이터정제,데이터병합등의데이터전처리에대해살펴보자.마지막시뮬레이션과데이터분석파트에서는11장에서복잡한실세계의문제를컴퓨터시뮬레이션으로해결하는원리를이해하고,12장에서사회관계분석을위한네트워크분석,13장에서인공신경망과딥러닝의원리를살펴본다.학습절차는시간적인제약과흥미에따라달리할수있을것이다.파트1과2는R의기초적인내용으로순서에따라학습하면좋을것이다.한편,파트3과4의각주제는장별순서대로학습하거나주제별로선별해서순서와무관하게학습할수있다.다만,8장의공공데이터활용과9장의네이버오픈API활용은7장의웹스크래핑원리를익힌후에학습하기를권한다.
파트3과4의각주제는개요,원리이해,기초실습,응용실습단계로기술하여,학습자가혼자서또는그룹으로토의하면서내용들을이해할수있도록하였다.또한,각주제별학습후에는연습문제와응용문제를통해스스로이해수준을파악하고응용력을키울수있도록하였다.