잡아라! 텍스트 마이닝 with 파이썬 (지금 바로 할 수 있는 데이터 추출과 분석)

잡아라! 텍스트 마이닝 with 파이썬 (지금 바로 할 수 있는 데이터 추출과 분석)

$17.85
Description
파이썬을 이용한 텍스트 마이닝으로
‘아’ 다르고 ‘어’ 다른 한글 텍스트 분석하기
알고리즘에 대한 수학적인 이해가 없어도 개념 파악을 도와주며 독자들이 코드를 따라하면서 결과를 바로바로 확인할 수 있도록 구성했다. 또한 텍스트 데이터 추출을 위해 필수적인 웹 크롤링 기술도 익힌다. 따라서 독자들은 어떠한 웹페이지라도 이 책의 내용을 응용하여 스스로 데이터를 추출 할 수 있다. 이 책을 본 이후에는 데이터 수집부터 분석까지 전 과정을 스스로 할 수 있다.

텍스트 마이닝 분야는 공학자들 이외에 인문, 사회, 예체능 학생들 및 기업에서도 논문, 마케팅을위해 쓸 수 있다. 세상 속에 존재하는 전체 데이터의 90% 이상이 비정형 텍스트 데이터로 이루어져 있다. 특히 각종 웹 페이지, sns 등에서 엄청난 양의 비정형 텍스트 데이터가 쏟아져 나오고 있다. 이러한 비정형 텍스트 데이터를 잘 활용한다면 연구, 기업 경영 전략에 매우 유익하게 활용될 수 있으며 이를 위해서는 텍스트 마이닝 기술이 필수적이다.
저자

서대호

한양대학교정보시스템학과를전공하고한양대학교산업공학과에서석사학위를받았으며이후한국과학기술원,모비젠,전자부품연구원에서연구원으로재직하며빅데이터분석을연구하였다.
현재연세대학교정보대학원에서박사과정중에있으며다수기업의데이터분석컨설팅,데이터분석솔루션개발을독자적으로맡아서하고있다.관심연구분야는텍스트마이닝,쇼핑몰인사이트분석및추천알고리즘,이상탐지,프로세스마이닝,이미지처리이다.또한빅데이터분석회사다겸(www.dagyeom.net)의대표로재직중이다.

목차

서문
저자소개
1.텍스트마이닝이란?
1.1.문서수집
1.2.문서특징

2.데이터사전처리를위한기초파이썬코딩
2.1.아나콘다설치
2.2.주피터노트북
2.3.pandas라이브러리
2.4.numpy라이브러리

3.텍스트데이터
3.1.정규표현식
3.2.사전처리
3.3.품사분석

4.텍스트마이닝기법
4.1.단어빈도분석-기본적인통계정보를알아보자!
4.2.군집분석-유사한문서들을모아보자!
4.3.토픽모델링-토픽모델링을이용하여문서의토픽을추론하자!
4.4.감성분석-텍스트의감성정도를지표로나타내자!
4.5.연관어분석

5.텍스트크롤링
5.1.Beautifulsoup을이용한크롤링
5.2.셀레니움을이용한크롤링
5.3.lxml을이용한크롤링

6.실전:트위터메시지분석

7.실전:소셜커머스후기분석

찾아보기

출판사 서평

이책의특징
-입문자를위한기초수준의파이썬기본문법들을소개한다.
-파이썬을이용한텍스트마이닝방법들의예제를소개한다.
-텍스트마이닝과함께사용할웹크롤링기법을소개한다.

이책이필요한독자
-텍스트마이닝을이용하여논문을쓰려는분
-웹에서발생하는텍스트정보를활용하여기업마케팅및인사이트도출을원하는분
-텍스트마이닝을공부하고싶은분

독자대상
초중급

소스코드다운로드
https://github.com/bjpublic/tmwithpython

우리는데이터의홍수속에서살아가고있지만넘치는데이터를전부받아들이고분석을할수없을것이다.데이터를분석하기위해서그만큼엄청난인건비와시간이소요되기때문이다.데이터의종류는많지만,우리가가장많이보고접하는데이터는역시텍스트데이터이다.따라서텍스트데이터분석이가장필요할것이다..

이책은공학도가아닌독자에게도유용할것이다.가장인기있는프로그래밍언어중하나인파이썬을이용해텍스트데이터수집을위한크롤링을넘어분석까지스스로할수있도록도와주면서파이썬과텍스트마이닝의기초를배우게될것이다.