데이터사이언스: 기초편

데이터사이언스: 기초편

$16.32
Description
데이터를 처리하고 분석하여 가치 있는 정보를 얻어서 활용하는 데이터사이언스는 현대사회를 이끌어감에 있어서 중요한 역할을 하고 있다. 데이터사이언스의 모든 과정을 능숙하게 처리할 수 있는 능력을 갖춘다는 것은 통계적 지식, 수학적 지식, 컴퓨팅 지식 등의 다양한 분야에서의 학습이 필요하므로 단기간의 지식 습득으로는 이루어지기 어렵다. 이런 어려움을 해결하기 위해 데이터사이언스를 지원해주는 툴(tool)들이 다양하게 개발되어 있지만 데이터분석에 대한 기초적인 개념과 분석방법에 대한 기본 지식이 있어야 툴을 이용해서 원하는 정보를 얻을 수 있으므로 최소한의 기초적 지식의 습득은 필요하다고 생각한다.
이 책에서는 이러한 툴 중에서, 접근성이 용이하고 그 활용도에 있어서 인정을 받고 있는 래피드마이너 스튜디오(RapidMiner Studio)를 활용하여 데이터사이언스에 대한 기본 지식을 습득할 수 있도록 구성하였다. 래피드마이너 분석프로세스는 프로그램 작성이나 코딩을 할 필요 없이 여러 오퍼레이터들의 조합이 그림으로 표현되어 사용자가 수월하게 결과를 얻을 수 있으며, 또 다양한 유형의 데이터에의 접근이 수월하다는 강점을 지니고 있다.
저자

김병수

서울대학교/통계학박사
(현재)인제대학교통계학과교수
주요연구분야:시계열분석,데이터마이닝

목차

PARTⅠ데이터탐색
CHAPTER01서론
1.1데이터사이언스
1.2데이터분석목적및기법
1.3래피드마이너
1.4래피드마이너스튜디오
1.5래피드마이너스튜디오설치
연습문제

CHAPTER02데이터
2.1변수
2.2통계량
2.3래피드마이너실습
연습문제

CHAPTER03데이터정제
3.1오류정보
3.2결측치및이상치
3.3변수생성
3.4자료저장
3.5DataEditor창
연습문제

CHAPTER04데이터시각화I
4.1도수분포표
4.2상자그림
4.3막대그래프
4.4히스토그램
4.5원그래프
연습문제

CHAPTER05데이터시각화II
5.1도수분포표
5.2요약통계량
5.3히스토그램과산점도
5.4상관분석
연습문제

PARTⅡ분석기법
CHAPTER06선형회귀분석
6.1선형회귀모형
6.2선형회귀모형의종류
6.3회귀계수추정
6.4모형평가
6.5변수선택
6.6래피드마이너실습
연습문제

CHAPTER07의사결정나무
7.1의사결정나무의개념
7.2의사결정나무의구성
7.3의사결정나무의형성
7.4의사결정나무의예측
7.5래피드마이너실습
연습문제

CHAPTER08신경망분석
8.1신경망
8.2신경망활용사례
8.3신경망작동원리
8.4래피드마이너실습
연습문제

CHAPTER09군집분석
9.1군집분석
9.2군집분석활용사례
9.3군집분석방법
9.4k-means방법
9.5래피드마이너실습
연습문제

오퍼레이터정리

출판사 서평

이책의구성

전체9장으로되어있고,데이터분석을위한기본개념과데이터에대한탐색(PARTⅠ:1~5장)과데이터사이언스의대표적인분석방법(PARTⅡ:6~9장)의두부분으로구성되어있다.학생들이이해할수있는기초적인수준의내용으로구성하기위해서,저자들이많은시간동안토론과고민을통해각장의주제를선별하여구성하였다.각장에서는주제에따른기초적인설명과함께래피드마이너스튜디오에서주어진데이터를이용하여학습한내용을실습하도록되어있다.분석순서에맞추어실습화면들이캡처되어있어서컴퓨팅에익숙하지않은학생들도수월하게내용을학습하고실습할수있으리라생각한다.
데이터사이언스에대한기초적수준의강의로활용하는경우,한학기강의용으로사용하면적당할것으로생각한다.다양한부분에서의활용도를생각하면분석방법에서의주제를더늘여야할필요도있겠지만,한학기교양강의를위한교재를목표로시작된책이니만큼데이터사이언스에대한첫걸음을도와주는단계로이책이활용되기를바란다.교재에사용된자료는생능출판사홈페이지(www.booksr.co.kr)에서내려받을수있다.