개념 잡는 데이터 분석 with 머신러닝

개념 잡는 데이터 분석 with 머신러닝

$33.80
Description
우리가 살고 있는 이 시대는 무한 경쟁 사회이며, 개인, 기업, 국가 모두가 경쟁력 강화를 위해 기술 발전에 힘쓰고 있다. 개인의 능력, 산업기술 보유, 국가 핵심기술 보유를 위해 지속적으로 노력하고 있는 것이다. 집중하고 있는 IT 분야의 핵심기술로는 인공지능, 데이터 분석, 블록체인, AR/VR, 클라우드 컴퓨팅, 자율 주행차, 나노 기술 등이 해당된다. 특히나 인공지능과 데이터 분석은 산업, 금융 등의 다양한 분야에서 고객의 니즈 파악과 보다 정확한 서비스를 위해 활용되고 있다. 이는 모든 분야에서 보편적인 도구로써 인공지능이나 데이터 분석 기술이 필요하다는 것이다.

즉, 의학, 금융 서비스, 비즈니스 인텔리전스 분야 등에서 데이터 분석 기술은 핵심 투자 집중 영역의 다양한 형태로 진화하고 있다. 이에 인공지능 및 데이터 분석 기술을 보다 쉽게 활용할 수 있도록 다양한 형태의 도구들이 생겨나고 있지만, 아직은 파이썬 언어를 이용한 인공지능이나 데이터 분석 기술 활용이 가장 쉽게 접근할 수 있는 방법 중의 하나이다.

본 교재는 이 같은 현시대의 수요를 반영하여 대학에서 교양 수준으로 머신러닝을 통한 데이터 분석을 누구나 쉽게 활용할 수 있도록 진입장벽을 낮추는 것에 초점을 두고 집필하였다. 데이터 분석이 무엇인지, 어떻게 하는 것인지 살펴보고, 데이터 분석을 위한 파이썬 언어에 대한 핵심 문법, 넘파이, 판다스, 시각화 라이브러리에 대하여 학습한다. 이후 네이버 트렌드, 행복지수, 날씨, 쇼핑몰, 드라마, 뉴스 등의 공공 데이터를 활용하여 데이터를 분석하고 머신러닝으로 예측 및 분류할 수 있는 미니 프로젝트를 다룬다.

머신러닝을 활용한 데이터 분석 기술을 보편적인 도구로써 누구나 쉽게 활용할 수 있는 그날까지 저자들은 끊임없이 고군분투할 것이다. 모쪼록 이 교재를 접한 모든 독자가 자신감을 가지고 데이터 분석에 대한 도전의 첫 단추가 잘 끼워지기를 기대한다.
저자

장은실,양숙희,오경선

JangEunSill
동국대학교에서컴퓨터공학전공공학박사학위를취득하였으며,2018~2020년에성균관대학교소프트웨어대학초빙교수와2020~2021년에한양대학교소프트웨어학부SW교육전담교수를거쳐2021년부터현재까지중부대학교학생성장교양학부조교수로재직중이다.경기도경제과학진흥원(GBSA),한국연구재단(NRF),정보통신기획평가원(IITP)등에서심사평가위원으로활동중이며,컴퓨팅기반문제해결,데이터분석,프로그래밍등의저서를집필하였다.

목차

Part1Why-빅데이터분석과머신러닝
CHAPTER1빅데이터분석과머신러닝
1.1빅데이터분석의이해
(1)빅데이터분석의정의
(2)빅데이터분석의필요성
1.2빅데이터분석처리과정
(1)문제해결의목적정의
(2)데이터수집
(3)데이터전처리와정형화(탐색적분석)
(4)머신러닝모델적용
(5)학습모델평가
1.3빅데이터분석과머신러닝과의관계
(1)지도학습
(2)비지도학습
(3)강화학습
(4)기타
연습문제

Part2What-빅데이터분석에필요한파이썬문법과라이브러리
CHAPTER2파이썬핵심문법
2.1코랩환경
(1)코랩기본사용법
2.2변수
(1)변수의개념
(2)변수의특징
(3)변수생성및규칙
2.3연산자
(1)산술연산자
(2)대입연산자
(3)비교연산자
(4)논리연산자
(5)문자열연산자
2.4표준입·출력
(1)표준입력
(2)표준출력
2.5컬렉션자료형
(1)컬렉션자료형개념과필요성
(2)리스트(list)
(3)튜플(tuple)
(4)딕셔너리(dictionary)
(5)세트(set)
2.6리스트내포
(1)리스트내포처리과정
2.7선택문
(1)파이썬선택문의개요
(2)조건식
(3)if/if~else
(4)if~elif/if~elif~else
2.8반복문과기타제어문
(1)파이썬반복문개요
(2)for문
(3)while문
(4)기타제어문
2.9함수
(1)함수란?
(2)내장함수
(3)사용자정의함수
(4)람다(lambda)함수
연습문제

CHAPTER3판다스라이브러리의개요
3.1판다스데이터의구조이해
(1)시리즈
(2)데이터프레임
3.2데이터프레임객체생성하기
(1)데이터프레임직접생성하기
(2)외부데이터이용하기
3.3데이터확인하기
(1)데이터프레임만들기
(2)변수속성파악하기
(3)데이터앞부분/뒷부분확인하기
(4)데이터요약통계량출력하기
(5)데이터행/열크기확인하기
(6)데이터인덱스/칼럼명확인하기
(7)데이터타입확인하기
(8)데이터정렬하기
(9)데이터빈도수구하기
(10)데이터고윳값구하기
3.4데이터선택하기
(1)칼럼(열)선택하기
(2)레이블이나조건표현으로선택하는방법:loc[]
(3)불인덱싱
3.5데이터가공및그룹핑
(1)칼럼삭제
(2)칼럼이름변경
(3)칼럼생성
(4)데이터그룹핑
3.6결측데이터처리하기
(1)결측데이터확인
(2)결측데이터삭제하기
(3)결측데이터최빈값으로대체하기
(4)결측데이터평균값으로대체하기
연습문제

CHAPTER4시각화라이브러리Ⅰ
4.1데이터시각화의이해
(1)데이터시각화의장점
(2)데이터시각화의활용사례
(3)파이썬으로하는데이터시각화
4.2맷플롯립라이브러리
(1)시각화옵션
(2)선그래프
(3)막대그래프
(4)산점도그래프
(5)히스토그램
(6)상자수염(BoxPlot)그래프
연습문제

CHAPTER5시각화라이브러리Ⅱ
5.1시본라이브러리의개요
5.2시본라이브러리
(1)데이터시각화준비하기
(2)시본막대그래프
(3)시본산점도그래프
(4)시본히스토그램
(5)시본상자수염(BoxPlot)그래프
(6)카운트플롯(CountPlot)그래프
(7)바이올린플롯(ViolinPlot)그래프
(8)시본히트맵(HeatMap)그래프
(9)다중플롯그리드그래프
연습문제

CHAPTER6빅데이터분석관련라이브러리종합실습
6.1한국드라마TOP100데이터분석하기
(1)데이터확인하기
(2)데이터선택하기
(3)데이터가공및그룹핑
(4)데이터시각화
연습문제

Part3how-머신러닝을이용한빅데이터분석실습
CHAPTER7데이터다듬기
7.1머신러닝단계
7.2탐색적데이터분석
(1)원본데이터관찰
(2)요약통계값확인
(3)시각화
7.3전처리방법
(1)데이터타입의변환
(2)결측치처리
(3)이상치처리
7.4제로콜라와기온속성간에는관련이있을까?
(1)문제정의
(2)데이터속성설명
(3)원본데이터관찰하기
(4)요약통계값확인하기
(5)전처리하기
(6)시각화로표현
(7)상관관계확인하기
7.5데이터탐색과전처리실습
(1)문제정의
(2)데이터속성설명
(3)원본데이터관찰하기
(4)요약통계값확인
(5)시각화로표현
연습문제

CHAPTER8행복지수데이터관계성찾기
8.1[상관분석]행복지수데이터분석하기
(1)데이터확인과가공하기
(2)데이터분석과시각화
8.2[연관분석]장바구니분석하기
(1)연관분석의개념이해
(2)연관분석의필요성
(3)연관분석의예제
연습문제

CHAPTER9날씨데이터예측하기
9.1회귀분석의개념
(1)회귀분석의개념이해
(2)기업의회귀분석활용사례
(3)단순선형회귀와다중선형회귀
9.2[회귀분석]날씨데이터분석하기
(1)데이터셋정보
(2)데이터필드의이해
(3)데이터확인과가공하기
(4)회귀분석예제
연습문제

CHAPTER10클러스터링을활용한쇼핑몰회원관리
10.1클러스터링
(1)K-Means
(2)Hierarchicalclustering
10.2클러스터링을활용한쇼핑몰회원세분화
(1)데이터읽기
(2)데이터탐색
(3)K-means를이용한군집화
(4)Hierarchicalclustering을이용한군집화
연습문제

CHAPTER11드라마분류하기
11.1K-최근접이웃
(1)K-최근접이웃의원리
(2)classsklearn.cluster.KNeighborsClassifier모델사용방법
(3)k의수
(4)표준화작업
11.2K-NN을이용한인기영화분류하기
(1)데이터읽기
(2)데이터탐색
(3)훈련데이터와테스트데이터나누기
(4)K-NN을이용한분류
11.3K-NN을이용한농구선수분류하기
(1)데이터읽기
(2)데이터탐색
(3)경력별선수의특징
(4)훈련데이터와테스트데이터나누기
(5)K-NN을이용한분류
연습문제

CHAPTER12텍스트로읽는세상
12.1자연어처리
(1)토큰화
(2)토큰화실습
12.2워드클라우드
(1)라이브러리설치하기
(2)한글글꼴설치
(3)텍스트가져오기
(4)품사태깅하기
(5)동일한단어의빈도수구하기
(6)wordcloud생성
(7)matplotlib으로시각화하기
12.3자연어처리실습
(1)뉴스기사로워드클라우드만들기
연습문제

출판사 서평

이책의특징과구성

이책은전공과상관없이데이터분석을쉽게배울수있는입문서이다.데이터분석을위한도구는많지만,상대적으로배우기쉬운파이썬을이용하여데이터분석방법에대하여설명한다.

이책의특징
-데이터분석을처음배우는학습자도이해하기쉽게내용을구성하였다.
-데이터분석을위한파이썬언어의핵심문법,넘파이,판다스,시각화라이브러리에대하여다룬다.
-다양한주제의공공데이터를활용한머신러닝기반의데이터분석미니프로젝트를구성하였고,
상황에맞는분석기법을선정하여파이썬으로다양한형태를분석할수있도록하였다.

이책의구성
본교재는크게3개분야로구성되어있는데,Part01.Why는빅데이터분석에대한개요를다루고,Part02.What은데이터분석에필요한파이썬핵심문법과관련라이브러리에대하여학습한다.Part03.How는다양한주제의데이터분석미니프로젝트를통해머신러닝을이용한데이터분석을실습한다.
강의계획은중간고사와기말고사를포함하여15주로구성하였다.파이썬에대한프로그래밍경험이없는학습자를위해2장에서파이썬핵심문법을다루었으나학습자의수준에따라융통성있게내용의폭과깊이를조절하여진행하면좋을것이다.