그림으로 배우는 데이터 사이언스 입문 (어려운 수식 없이 엑셀로 이해하는 데이터 사이언스)

그림으로 배우는 데이터 사이언스 입문 (어려운 수식 없이 엑셀로 이해하는 데이터 사이언스)

$23.52
Description
“데이터 사이언스 입문 책으로 적절합니다.”
인터넷이 고도로 발전한 오늘날, 우리는 알게 모르게 다양한 데이터에 둘러싸여서 일상생활을 보내고 있다. 이런 사회를 책에서는 ‘데이터화 사회’라 칭하고 있지만, 이는 데이터가 없으면 흔한 일상생활을 보내기 어렵다는 것을 의미한다. 이처럼 현대 사회에서는 ‘데이터’의 가치가 올라가고 있기에 데이터를 다루는 과학이 생기는 것은 당연한 일이며, 이러한 과학을 데이터 사이언스라고 한다. 우리가 알아야 할 데이터 사이언스의 기본 개요와 사고방식을 쉽게 설명하기 위해 책에 일러스트와 도표를 적극적으로 활용하였다. 어려운 수식 없이 이해할 수 있도록 만들었기 때문에 데이터 사이언스에 입문하고자 한다면, 이 책으로 시작하길 권한다.
저자

우와후지이치로우

(上藤一郎)
시즈오카(静岡)대학인문사회과학부교수.전공은통계학,과학사(통계학사,확률논사).데이터사이언스관련저서ㆍ번역으로[データサイエンス入門-Excelで学ぶ統計データの見方ㆍ使い方ㆍ集め方]옴사(공저),[調査と分析のための統計-社会ㆍ経済のデータサイエンス]丸善(마루젠)(공저),[数式なしでわかるデータサイエンス-ビックデータ時代に必要なデータリテラシー]옴사(번역)등

목차

들어가기앞서
저자소개
역자의말
역자소개

제1장데이터사이언스란?-데이터와사회-
1-1데이터와사회
1우리의일상생활과데이터
2다가온데이터화사회

1-2데이터사이언스와데이터사이언티스트
1데이터사이언스는다양한정의가가능한과학
2데이터해석의4가지공정
3데이터사이언티스트의업무

제2장데이터를알자-데이터해석의제1공정-
2-1데이터타입을분류한다
1조사데이터와비조사데이터
2빅데이터와비(非)빅데이터

2-2데이터특징을잡아라
1변수와데이터
2양적데이터와질적데이터
3개표(個票)데이터와집계데이터

2-3데이터를준비한다
1조사에의한데이터수집
2웹에서데이터수집

2-4데이터를정형화한다
1데이터를정형화하는것은
2완전데이터와불완전데이터
3이상치
4선택편향(Bais)

제3장데이터읽기-데이터해석의제2공정-
3-1데이터를집계하고가시화한다
1데이터분포를파악한다
2다양한그래프

3-2데이터정보를요약한다
1데이터정보를얻는다
21변수데이터의특징을알다
32변수의관계를발견한다
4다차원데이터의관계를파악한다
5결론을일반화하기위해서

제4장데이터를분류하다-데이터해석의제3공정-
4-1비슷한것들을분류한다
1클러스터분석의사고방식
2클러스터분석으로분류한다

4-2복수변수를합성한다
1주성분분석의사고방식
2주성분분석으로분류한다

4-3질적데이터를분석하다
1수량화Ⅲ류의사고방식
2수량화Ⅲ류로분석한다

제5장데이터로부터예측한다-데이터해석의제4공정-
5-1데이터에기반해서예측한다
1회귀분석의사고방식
2회귀분석으로예측한다

5-2예측의질을평가한다
1다중회귀분석의사고방식
2좋은회귀모델이란
3다양한회귀진단

5-3질적데이터를예측한다
1수량화Ⅰ류
2로지스틱회귀

제6장데이터윤리를생각하다-데이터화사회에경종-
6-1데이터윤리란
1데이터윤리와데이터화사회
2정보윤리의4가지원칙과데이터윤리의규범예
3분석의윤리

6-2윤리위반사건집
1디오반사건
2통계부정사건

제7장데이터사이언스와AI-빅데이터가가져온데이터혁명-
7-1기계학습의기본
1기계학습ㆍ심층학습ㆍAI
2데이터프리퍼레이션
3선택알고리즘
4파라미터튜닝
5모델선택

7-2뉴런네트워크와AI
1AI와데이터사이언스의관계
2뉴런네트워크란
3뉴런네트워크의구성요소

부록데이터사이언스를체험하다
데이터사이언스의이해를높이기위한참고도서
찾아보기

출판사 서평

“어려운수식없이,그림과표로쉽게이해하는데이터사이언스”

겉보기에는유사한숫자배열에불과한데이터라도경제데이터와의학데이터에서는작성방법이나취급하는방법이전혀다르고,의미와해석도다르다.이처럼데이터성질의차이를중시하는,즉,‘데이터중시’라는시점을데이터사이언스에서는무엇보다중요하다고하는것이이책의기본적인생각이다.따라서정보통신기술의활용은어디까지나이러한일련의프로세스를효율적으로수행하기위한‘조연’에불과하다.

이런목적을달성하기위해책에서는다음과같이서술하였다.
1)‘데이터중시’라는사고방식으로,데이터타입및특징에관련된데이터수집방법을하나의장을할애해자세히설명했다.

2)데이터사이언스의요점은데이터해석방법에있다.책에서는슈퍼마켓에근무하는마케팅담당A씨,세미나에서지역연구하는대학생B씨,지역건강문제에관심이많은보건사C씨의사례를들었으며,각자의연구를통해데이터해석방법의목적과결과해석을설명한다.또한수학에대한예비지식이없어도이해할수있도록수학적전개는생략한다.

3)데이터해석방법을분류방법과예측방법으로나눠,대표적인양적데이터와질적데이터를다루는방법을각각다룬다.

4)사고방식과계산결과의해석을중심으로데이터해석방법을설명하지만데이터해석을실제로체험하는일도중요하다.그렇기에책에서소개하는방법중에Excel로간단하게계산할수있는경우대응하는함수및분석툴사용방법을설명한다.

5)데이터사이언스는데이터가전부라해도과언이아니다.수학적으로의심스러운어떠한데이터해석방법을적용하더라도,데이터를개조하거나날조하면알수가없다.이를위해하나의장을할애해데이터개조사례와윤리규범을설명한다.

6)책에서는빅데이터만이데이터사이언스의대상이아니라고하지만,빅데이터역시데이터사이언스의중요한대상이다.따라서빅데이터활용이라는시점에서봤을때데이터사이언스와AI및기계학습의관계를하나의장을할애해설명한다.

데이터사이언스라는말은최근몇년동안사용빈도가무척늘었다.그런의미에서하나의유행어처럼되었고,‘데이터화사회’에서는데이터가중요한의미가있으므로,다양한분야를포함한데이터사이언스의내용및체계를정리하는데도움이되길바란다.이책을통해독자여러분이데이터에관심을가지고,데이터사이언스에대한이해가깊어지길바란다.