파이썬을 활용한 빅데이터분석 개론

파이썬을 활용한 빅데이터분석 개론

$30.06
Description
이 책은 빅데이터 분석의 입문자를 위한 개론서다. 개론서는 기본서로서 전공 분야의 전반적인 내용과 지식을 담고 있기에 전공 분야의 참고서적으로 활용된다. 그러나 4차 산업혁명의 특징인 융복합이라는 포괄적인 개념으로 전공 분야의 내용과 지식의 범위가 점차 확대되고, 그 경계가 모호해지는 경향이 있기에 이 책에 수록할 내용의 폭과 깊이에 대해 적잖은 고민을 할 수밖에 없었다.
빅데이터 분석을 포함하여 빅데이터를 분석하기에 앞서 요구되는 절차들과 분석 이후의 평가와 해석 등을 모두 다루기에는 내용이 너무 방대하므로 이 책의 목적은 빅데이터 분석의 기초로서 소개와 이해에 있으며 다양한 분석 방법을 나열하여 설명하기 보다는 어떤 데이터로 어떤 분석을 통해 어떤 결과를 얻어낼 수 있으며 그 결과물에 대한 기초적인 해석에 초점을 두고 있다.
이 책에서는 관련 서적에서 많이 활용되고 있고, 인터넷에서 쉽게 얻을 수 있는 데이터를 사용하였고, 이 데이터를 통해 탐색적 데이터 분석 과정을 설명하기 위하여 파이썬 언어를 사용하였다. 그리고 파이썬 언어를 이용한 빅데이터 분석의 예를 통계적 기법의 다변량 분석을 통해 알기 쉽게 설명하고자 하였다.
이 책의 앞부분에서는 프로그램 언어의 경험이 없더라도 빅데이터를 분석하기 위한 도구로서 쉽게 활용할 수 있는 파이썬 언어와 라이브러리들을 소개하였고, 파이썬 언어의 기본적인 사용 방법과 그래프의 작성과 표현, 데이터를 요약하는 방법들의 예를 소개하고, 프로그램과 결과를 통해 확인해 나갈 수 있도록 하였다.
책의 중간 부분은 분석에 앞서 데이터를 수집하는 방법들, 데이터를 분석에 맞게 수정하거나 편집하는 방법들, 그리고 탐색적 데이터 분석을 통해 데이터 자체에 내재된 특성을 파악하는 방법의 예를 설명하였고, 파이썬을 통해 경험해 볼 수 있도록 하였다. 그리고 마지막 부분에서는 다변량 분석을 중심으로 데이터 분석의 예와 더불어 파이썬 프로그램의 결과와 의미에 대해서 설명하였다.
앞서 설명하였듯이 이 책은 입문서이므로 복잡한 수학적 표현은 생략하고 대신 그림을 통하여 쉽게 설명하였고, 어떤 부분에 대해서는 분석 절차와 분석 결과를 축소하거나 생략하였다.
저자

안기수

성균관대학교경상대학통계학과졸업
성균관대학교대학원통계학과졸업(경제학석사)
성균관대학교대학원통계학과전산통계전공(경제학박사)
현재동남보건대세무회계학과교수
〈저서〉
단계별로설명한C프로그래밍(2000,생능출판사)
응용프로그램개발을위한명품C언어프로젝트(2010,생능출판사)
명품C언어프로그래밍(2013,생능출판사)
엑셀로풀어보는생활속의통계학(2021,생능)

목차

CHAPTER01빅데이터
1.1빅데이터란?
1.2빅데이터처리와분석
1.3빅데이터관련직업분류와자격증
1.3.1빅데이터직업분류
1.3.2관련자격증
1.4빅데이터와인공지능
1.5개인정보보호와정보활용
1.5.1개인정보보호법
1.5.2개인정보의유형
1.5.3개인정보의사례와판례
1.5.4개인정보의수집과이용
1.5.5마이데이터
단원정리
연습문제

CHAPTER02파이썬언어
2.1설치와프로그램의실행
2.1.1파이썬언어
2.1.2설치와실행
2.1.3라이브러리
단원정리2.1
연습문제2.1
2.2기초문법
2.2.1print함수와연산자의사용법
2.2.2데이터의입력과변수
2.2.3프로그램의제어
2.2.4특별한기능을처리하는단위,함수
단원정리2.2
연습문제2.2
2.3데이터시각화와요약
2.3.1그래프를통하여데이터의특성을나타내는방법들
단원정리2.3.1
연습문제2.3.1
2.3.2데이터의특성을숫자로요약하는방법들
단원정리2.3.2
연습문제2.3.2

CHAPTER03데이터수집
3.1데이터수집
3.2공공데이터가져오기
3.3데이터제공사이트
단원정리
연습문제

CHAPTER04데이터다루기
4.1데이터구조인리스트와배열의사용방법
4.1.1리스트(list)
4.1.2배열
4.2데이터구조의변환
4.3데이터파일다루기
4.3.1데이터파일불러오기
4.3.2데이터파일생성하기
4.4결측값다루기
4.4.1결측값확인하기
4.4.2값대체하기
4.4.3결측사례삭제하기
단원정리
연습문제

CHAPTER05탐색적데이터분석과시각화
5.1타이타닉데이터를이용한분석
5.1.1변수와값
5.1.2탐색내용
단원정리5.1
연습문제5.1
5.2텍스트마이닝의시각화
5.2.1단어구름
5.2.2히트맵
5.2.3네트워크다이어그램
단원정리5.2
연습문제5.2

CHAPTER06데이터분석모형
6.1통계기반데이터분석모형
6.1.1기술통계와추론통계
6.1.2추정과가설검정
6.1.3모수검정과비모수검정
6.1.4단변량,다변량,단순,다중분석
단원정리6.1
연습문제6.1
6.2데이터마이닝기반데이터분석모형
단원정리6.2
연습문제6.2
6.3머신러닝기반분석모형
단원정리6.2
연습문제6.2

CHAPTER07분석기법
7.1상관분석과회귀분석
7.1.1상관분석
7.1.2회귀분석
7.1.3로지스틱회귀
단원정리7.1
연습문제7.1
7.2다변량분석
7.2.1변수간의관계분석
7.2.2개체간의관계분석
단원정리7.2
연습문제7.2

참고문헌

출판사 서평

이책은총7개의장으로구성되어있으며특징은다음과같다.
-공학계열의전공자뿐만이아니라인문계열의비전공자들도빅데이터분석의개념을이해할수있도록쉽게설명하였다.
-파이썬프로그램에대한지식이없어도빅데이터분석과처리에파이썬언어를활용할수있도록예를들어이해하기쉽게설명하였다.
-빅데이터분석의개념을쉽게이해할수있도록수학적표현을생략하고그림과이미지를통해서설명하였다.
-빅데이터분석의예제와연습문제에서다룬데이터는파이썬라이브러리를통해쉽게이용할수있거나실생활에서쉽게접할수있는데이터로구성하였다.