AI를 위한 데이터 분석 기초 (인공지능을 통한 문제해결의 시작)

AI를 위한 데이터 분석 기초 (인공지능을 통한 문제해결의 시작)

$32.44
Description
“데이터를 지배하는 자가 세상을 지배한다.”
- 팀 오라일리(Tim O’reilly): 오라일리 미디어 창립자

“데이터는 우리가 하는 모든 일에 힘을 실어준다.”
- 제프 와이너(Jeff Weiner): 링크드인(LinkedIn) 최고 경영자

- 데이터 분석, 선택이 아니라 필수!
오늘날 우리는 데이터의 홍수 속에 살고 있다. 넘치는 데이터를 수집하고 분석하여 새로운 지식을 발견할 수 있는 것은 물론 산재한 많은 문제들의 해결을 위하여 관련 데이터의 분석은 필수적 사항이다. 나아가 인공지능이 핵심 경쟁력으로 대두되고 있는 지금, 데이터를 학습시키는 기계학습을 위하여서는 데이터 분석에 대한 이해가 필수적이라 할 수 있다. 교육 현장에서 또한 급변하는 IT 중심 시대에 국가 경쟁력을 확보하기 위해서는 데이터 분석에 대한 활용과 교육이 반드시 필요하다고 주장하고 있다. 이에 이 책을 통해 대한민국의 AI 기술력 저면 확대에 작게나마 기여하고자 한다.
오늘날 데이터는 누구에게나 접근 가능한 자원이다. 스스로 필요한 데이터를 수집하여 분석할 수 있는 환경이 이루어져서 데이터 분석이 더 이상 전문가들만을 위한 영역에 속하지 않는다. 이러한 시대적 변화에서 데이터를 분석할 수 있는 능력은 개인의 문제해결 능력이자, 인공지능 분야에서 다양한 융합적 해결 방안을 제시하여 국가 경쟁력을 높일 수 있는 기초 능력에 해당한다. 데이터 분석을 통하여 의미 있는 정확한 결과가 도출될 수 있으며, 의미 있는 결과를 선점하는 사람이 경쟁력을 확보할 수 있는 인재로 성장할 수 있다. 이론적으로 제한된 분석을 진행하는 것이 아니라 프로그래밍 과정을 통하여 실제적으로 데이터 분석을 경험하고, 결과를 도출하고자 하는 목적으로 이 책을 구성하였다.
저자

한옥영

현재성균관대학교학부대학과인공지능융합교육전공전임교수이다.2000년부터성균관대겸임및초빙교수로일했다.주요관심분야는컴퓨팅사고,소프트웨어교육,인공지능,데이터분석,자료구조,알고리즘등이다.펴낸책으로『컴퓨팅사고를위한파이선입문』,『한권으로시작하는소프트웨어』,『문제해결과알고리즘』(공저)과고등학교인공지능심화교과서『학교에서만나는인공지능수업』이있다.

ㆍ한국산업기술진흥협회2022년기술애로해결
지원사업참여
ㆍ교육부2022년초중등교원양성대학AI교육강화지원
사업참여
ㆍ과학기술정보통신부2022정보교육네트워크운영참여
ㆍ교육부디지털신기술인재양성혁신공유대학사업
(인공지능)참여
ㆍ삼성주니어SW아카데미효과성및성과분석참여
ㆍ성균관대학교소프트웨어중심대학사업참여
ㆍ성균관대학교소프트웨어교양필수과목개발
ㆍ한국정보화진흥원ICT기반국가미래전략과제참여
ㆍ정보통신산업진흥원SW+인문포럼위원활동
ㆍ대한상공회의소컴퓨팅사고능력출제및감수
ㆍ인터넷중독전문상담가
ㆍ인터넷윤리지도사

목차

서문

1장데이터분석
1-1데이터분석의여정
1-2데이터이해하기
1-3데이터분석개념

2장데이터이해와활용
2-1빅데이터이해
2-2다양한공공데이터
2-3CSV파일활용
2-4공공데이터활용

3장데이터수집방법
3-1웹크롤링자료수집
3-2텍스트자료수집
3-3설문데이터수집
3-4실전데이터수집도전

4장엑셀파일다루기
4-1엑셀데이터읽기
4-2엑셀데이터처리
4-3엑셀데이터활용도전

5장탐색적데이터분석
5-1데이터분석목적이해하기
5-2데이터처리과정
5-3결측치와이상치
5-4EDA도전

6장데이터분석방법론
6-1데이터분석방법론이란?
6-2회귀분석방법
6-3분류분석방법
6-4군집분석방법
6-5데이터분석도전

7장데이터분석을위한Numpy
7-1Numpy이해하기
7-2배열프로세싱
7-3Numpy데이터분석도전

8장Pandas활용데이터분석
8-1Pandas이해하기
8-2데이터프레임프로세싱
8-3Pandas데이터분석도전

9장데이터시각화를위한matplotlib
9-1시각화이해하기
9-2pandas활용시각화
9-3Matplotlib활용시각화
9-4데이터분석시각화도전

10장확률분석
10-1확률분석이해하기
10-2확률변수
10-3Scipy를이용한확률분석
10-4확률분석도전

11장통계분석
11-1통계분석이해하기
11-2기술통계
11-3통계분석도전

12장텍스트데이터빈도분석
12-1텍스트데이터이해하기
12-2자연어처리(NLP)
12-3텍스트데이터빈도분석도전

13장감성분석
13-1감성분석이해하기
13-2감성분석적용분야
13-3감성분석도전

14장실전데이터분석
14-1요즘인기있는음악은?
14-2요즘인기있는Youtube방송은?
14-3네이버월별키워드검색현황은?

부록
부록-1Python만나기
부록-2Python기본문법
부록-3Python활용

출판사 서평

-이책의특징
●각단원별로실습코드에대한설명을포함하여이론적이해에서더나아가파이선(python)을활용하여스스로데이터분석을할수있도록하였다.파이선코드에대한경험이부족한경우에도예시코드를통해스스로데이터를분석할수있도록구성하였다.
●데이터분석에대한이론적이해와더불어활용적적용에초점을두었다.
●자신이가지고있는데이터를원하는목적에맞게분석하여원하는문제해결을이룰수있을것이다.
●나아가데이터분석을통해통찰력을구비하여모두가인정하는문제해결능력자로성장할수있을것이다.

-데이터분석과파이선(Python)
인공지능에관심이집중되기시작하면서데이터분석이두각을나타나게되었다.인공지능의핵심부분에해당하는기계학습(MachineLearning)은기계가스스로학습하는것이고,기계가스스로학습하기위해서는데이터가절대적으로중요한요소가된다.데이터를올바르게분석하지못한다면,기계학습의결과는무용지물이될뿐이다.원하는결과를얻기위한데이터분석의여정은결코쉬운도전은아닐수있다.그러나가치있는도전이고,누군가에게는피할수없는운명적도전이될것이다.이러한도전이조금더효율적이고쉽게이루어지도록,이책은독자의입장에서최대한친절하게설명할것이다.
데이터분석을위하여프로그래밍은필수이다.이책에서는파이선(Python)을사용하여데이터분석하는과정을소개한다.파이선은High-LevelProgrammingLanguage에해당하는데,여기서High-Level의의미는사람이사용하는언어에가장가까운프로그래밍언어로이해하면된다.따라서간단하고직관적인문법으로이루어져이해하기쉽다는장점이있다.

-데이터분석의목표
데이터분석의목표는파이선을도구로하여데이터가가지는의미를읽어내는것이다.의미를정확하게이해한다면,데이터를학습하여데이터가창출하는가치를찾을수있을것이다.새롭게창출된가치를통하여우리는우리에게직면한문제를해결할수있으며,우리앞에발생할수있는위험들을예측하여대비할수있을것이다.
즉,데이터분석은단순히하나의학문이아니라,우리가더나은삶을살아가기위한필수항목인것이다.그렇지만이책한권만공부하면데이터분석을완전마스터할것이라꿈꾸면안된다.이책은데이터분석에대한방법론과접근법에대한기초적인접근을파이선을활용하여설명할뿐이다.이책을통하여데이터완전정복을이루는첫발걸음을시작할수있을것이다.

-인공지능과데이터
데이터는지금이순간에도쉬지않고기하급수적으로생성되고있으나방대한양의데이터를일일이유의미한정보로전환하기에인간의두뇌에한계가있다.그렇기에우리는현재컴퓨팅자원(CPU,GPU등)을이용하여데이터를병렬적이게,굉장히빠른속도로처리하여무수히많은정보를생성하고있다.이렇게생성된수많은정보를또다시조합하여지식을생성하는데에는예측의과정이필요하며,예측은지능을통해이루어진다.정보생성과마찬가지로사람이예측을통한지식생성을전부담당할수없기에,인간대신예측을수행하는인공지능(Artificialintelligence,AI)이발명되었다.인공지능은알고리즘을기반으로학습을통해데이터속에서규칙을찾아내어모델을생성한다.
오늘날의과학은데이터중심의과학이라할수있다.생활전반에는인공지능이,즉데이터과학이숨쉬고있으며,그영역또한확장되고있다.그렇기에데이터과학의이해와이를실현하기위해요구되는프로그래밍역량은현재를살아가는세대의필수역량이라할수있다.