파이썬을 이용한 빅데이터 분석

파이썬을 이용한 빅데이터 분석

$27.74
Description
이 책에서는 기계학습 개론 책에서 흔히 등장하는 복잡하고 쉽지 않은 수식을 가급적 빼고 예제를 통해 개념을 설명하고자 한 것이 특징입니다. 즉, 기계학습 이론을 발전시키는 관점보다는 기계학습이라는 도구를 실제 문제에 적용할 수 있는 능력을 키우기 위한 기초도서로 활용할 수 있도록 하였습니다. 이 책의 앞 부분에는 우선 기계학습을 이용한 데이터 분석 개요에 대해 기술합니다. 그 이후에 선형회귀분석을 이용한 데이터 분석, 트리를 이용한 데이터 분석, 인공신경망을 이용한 데이터 분석, SVM을 이용한 데이터 분석, 텍스트 데이터 분석, K-means와 K-nearest neighbor 방식을 이용한 데이터 분석방법 등에 대해 기술합니다. 마지막으로 다양한 특징을 가진 데이터를 조금 더 단순화시켜 접근하는 것이 가능할 수 있는 주성분 분석(PCA) 등의 방법 등에 대해 기술합니다.
저자

유성준

목차

CHAPTER1개요
1.1빅데이터분석개요
1.2데이터분석을위해필요한역량
1.3이책의구성

CHAPTER2기계학습을이용한데이터분석
2.1기계학습(MachineLearning)소개
2.1.1기계학습
2.1.2기계학습기술
2.1.3기계학습을활용한데이터분석
2.2예측모델성능평가
2.2.1데이터셋구성을통한검증방법
2.3데이터를사용한실습
2.3.1ScikitLearn제공ToyData를사용한실습

CHAPTER3선형회귀분석을이용한데이터분석
3.1단일선형회귀분석
3.1.1단일선형회귀분석이란?
3.1.2단일선형회귀모델소개
3.1.3적합도검증
3.1.4성능평가
3.1.5단일선형회귀분석실습?Basic1
3.1.6단일선형회귀분석실습?Basic2
3.2다중선형회귀분석
3.2.1다중선형회귀분석이란?
3.2.2적합도검증
3.2.3다중선형회귀분석실습?Basic1
3.2.4다중선형회귀분석실습?Basic2

CHAPTER4트리를이용한데이터분석
4.1의사결정트리를이용한데이터분석
4.1.1의사결정트리(DecisionTree)란?
4.1.2의사결정트리구성요소
4.1.3DecisionTree분석과정
4.1.4예제를이용한의사결정트리동작과정
4.1.5의사결정트리분리기준(SplitCriterion)
4.1.6예제를이용한의사결정트리실습
4.2랜덤포레스트(RandomForest)를이용한데이터분석
4.2.1랜덤포레스트소개
4.2.2랜덤포레스트이론
4.2.3Iris데이터를이용해간단한랜덤포레스트구현

CHAPTER5인공신경망을이용한데이터분석
5.1인공신경망(ArtificialNeuralNetwork:ANN)
5.1.1인공신경망개념
5.1.2인공신경망종류?단일계층신경망
5.2인공신경망을이용한데이터분석
5.2.1인공신경망의종류?다층신경망
5.2.2예제를이용한인공신경망실습

CHAPTER6SupportVectorMachine
6.1SupportVectorMachine(SVM)개요
6.1.1SVM개념
6.2SupportVectorMachine실습
6.2.1Pythonpackage로드
6.2.2Irisdataset로드
6.2.3Irisdataset정보확인
6.2.4데이터학습
6.2.5데이터시각화전처리
6.2.6데이터시각화및성능측정
6.3SVM의Parameter조정하는방법실습

CHAPTER7NaiveBayes
7.1NaiveBayes개념
7.1.1NaiveBayes란?
7.1.2베이즈정리(Bayestheorem)
7.1.3조건부확률(ConditionalProbability)
7.1.4라플라스스무딩(LaplaceSmoothing)
7.1.5Log변환
7.2예제를이용한NaiveBayes
7.3예제를이용한NaiveBayesPython코드실습
7.3.1필요한package로드
7.3.2예제데이터로드
7.3.3데이터전처리
7.3.4데이터분리
7.3.5Train,TestSet구성
7.3.6나이브베이즈모델생성
7.3.7클래스예측
7.3.8예측클래스확인
7.3.9분류성능측정

CHAPTER8영문텍스트데이터분석
8.1텍스트분석
8.1.1텍스트분석
8.1.2토큰화
8.1.3어간추출
8.1.4형태소분석
8.1.5정보추출
8.1.6문서분류
8.1.7감성분석
8.2영문텍스트데이터분석
8.2.1텍스트분석
8.2.2영어뉴스데이터수집
8.2.3텍스트데이터전처리
8.2.4WordCloud
8.2.5특징값추출
8.2.6뉴스분류

CHAPTER9한국어텍스트데이터분류
9.1한국어텍스트데이터분류
9.1.1한국어텍스트데이터분류
9.1.2데이터셋과특징값추출
9.1.3분류

CHAPTER10기타기계학습을이용한데이터분석
10.1K-means
10.1.1K-means알고리즘이란?
10.1.2K-means클러스터링예제
10.1.3Scikit-learn(Sklearn)패키지소개
10.1.4K-means실습
10.2K-NearestNeighbors(KNN)
10.2.1K-NearestNeighbors(KNN)알고리즘이란?
10.2.2Scikit-learn(Sklearn)패키지소개
10.2.3KNN실습

CHAPTER11PCA와LDA
11.1차원축소
11.1.1차원(Dimensionality)
11.1.2차원의저주(CurseofDimensionality)
11.1.3차원축소방법
11.2PCA
11.2.1PCA
11.2.2고유벡터(Eigenvectors)와고유값(Eigenvalues)
11.2.3PCA를사용한데이터재구성
11.3LDA
11.3.1LDA
11.4데이터를사용한실습
11.4.1필요한패키지import
11.4.2원본데이터확인
11.4.3PCA
11.4.4LDA
11.4.5원본,PCA,LDA시각화결과비교