Do it! 쉽게 배우는 R 텍스트 마이닝

Do it! 쉽게 배우는 R 텍스트 마이닝

$20.00
Description
4년간 R 데이터 분야 1위 도서 저자의 후속작 ‘텍스트 마이닝’ 도서 출간!
형태소 분석, 긍정·부정 분위기 분석, 연관 단어 분석, 시각화 모두 내 손으로!
봉준호 감독의 영화 〈기생충〉이 오스카상 4관왕을 수상한 사실은 이제 모두가 알고 있다! 그런데 온라인 댓글 분위기는 천차만별이었네? 이 영화가 대체 어땠길래? 당시 분위기를 분석하고 돌아볼 수는 없을까? 영화 평가가 긍정·부정적이었는지, 영화 자체의 평이 많은지 아니면 영화 외적 요소의 평이 많은지 궁금하다. 이제 김영우 선생님과 함께 R로 텍스트 마이닝을 해보자! 이 책은 직장인, 대학생, 연구자 누구나 쉽게 텍스트 분석을 할 수 있다. 한글 텍스트 분석은 물론 30종 넘는 다양한 그래프까지! 보고서에 바로 사용할 수 있는 다양한 결과물을 내 손으로 직접 만들 수 있다.
저자

김영우

데이터로세상을이해하는일을하는데이터분석가.기업,대학,연구기관,시민단체등다양한조직의데이터분석프로젝트를진행하고있다.측정,실험,데이터를좋아하고혈액형성격론,타로카드,자기계발서를싫어한다.데이터에기반을둔대화를추구하므로지인들로부터신뢰할만하다는평을듣지만친구는별로없다.초보자도어깨춤을추며데이터를분석하게만드는강의를진행하고있다.SKT,KT,엔씨소프트,삼성금융연수원,LG인화원,멀티캠퍼스,패스트캠퍼스등에서강의했다.데이터저널리스트로활동하며데이터저널(datajournal.kr)을운영하고있으며,데이터전문팟캐스트〈데이터홀릭〉을진행하고있다.현재레어템을좋아하는여인에게수집돼함께살고있으며,가장효율적으로아무것도안하는고양이두마리를모시고있다.

목차

__1장단어빈도분석:무엇을강조했을까?
_01-1텍스트전처리
_01-2토큰화하기
_01-3단어빈도분석하기

__2장형태소분석기를이용한단어빈도분석
_02-1형태소분석
_02-2명사빈도분석하기
_02-3특정단어가사용된문장살펴보기

__3장비교분석:무엇이다를까?
_03-1단어빈도비교하기
_03-2오즈비-상대적으로중요한단어비교하기
_03-3로그오즈비로단어비교하기
_03-4TF-IDF-여러텍스트의단어비교하기

__4장감정분석:어떤마음으로글을썼을까?
_04-1감정사전활용하기
_04-2댓글감정분석하기
_04-3감정범주별주요단어살펴보기
_04-4감정사전수정하기

__5장의미망분석:어떤맥락에서단어를썼을까?
_05-1동시출현단어분석-Co-occurrenceanalysis
_05-2동시출현네트워크-Co-occurrencenetwork
_05-3단어간상관분석-Phicoefficient
_05-4연이어사용된단어쌍분석-n-gram

__6장토픽모델링:어떤주제로글을썼을까?
_06-1토픽모델링개념알아보기
_06-2LDA모델만들기
_06-3토픽별주요단어살펴보기
_06-4문서를토픽별로분류하기
_06-5토픽이름짓기
_06-6최적의토픽수정하기

__7장텍스트마이닝프로젝트:타다금지법기사댓글분석
_07-1주요단어살펴보기
_07-2공감,비공감댓글비교하기
_07-3관심댓글비교하기
_07-4단어간관계살펴보기
_07-5토픽모델링

__8장텍스트마이닝프로젝트:차기대선주자SNS여론분석
_08-1SNS언급량추이살펴보기
_08-2SNS이슈살펴보기
_08-3감정단어살펴보기
_08-4감정경향살펴보기
_08-5감정추이살펴보기
_08-6긍정,부정트윗단어비교하기

__9장텍스트를효율적으로분석하는방법
_09-1텍스트데이터수집하기
_09-2텍스트분석품질높이기
_09-3완전유용한꿀팁

출판사 서평

R을배웠는데어떻게써먹어야할지모르는사람모두모여라!
실전에주제별로응용할수있는학습·실습구성으로알차다!
텍스트마이닝을진짜내가할수있을까?이책과함께라면당연히할수있다!저자는R에입문한사람이라면누구나따라할수있는구성으로‘완벽한텍스트마이닝실습매뉴얼’을준비했다.이책은텍스트마이닝실전연습을충분히할수있도록현재우리사회에서이슈가되고있는4가지주제를중심으로데이터를엄선하여텍스트마이닝실습을진행한다.‘대통령연설문’,‘영화〈기생충〉오스카상수상댓글’,‘타다금지법댓글’,‘내년대선후보댓글’의4가지실제사례를분석하며개념을이해하는과정으로구성해서처음에는복잡해보이는개념도실습을진행하다보면술술이해될것이다.
정말로,진짜로,어디까지내손으로할수있을까?
형태소분석부터단어분석,감정분석등‘고급데이터분석과정’모두수록!
이제는데이터분석기초능력만향상할것이아니라실제사례를분석할줄아는능력을키워야하는시대가되었다.개발자,마케터,프로젝트관리자등모두가알아야할기초소양이된것이다.이책은문장을구성하는명사,동사,형용사등과같은품사를분류하는작업인형태소분석부터상대적으로중요한단어를짚어주는‘오즈비’,‘로그오즈비’활용,감정사전을활용한문장의감정분석,동시출현네트워크를활용한단어맥락분석,단어가사용된문단의주제를찾아주는‘토픽모델링’까지!‘텍스트데이터분석고급과정’을직접해낸사람으로만들어준다.게다가텍스트데이터분석이편해지는‘꿀팁’부터코드를실행하다함정에빠지기쉬운부분까지짚어주니그야말로‘텍스트마이닝꿀단지’이다.
내일‘사용자선호도분석’보고서를제출해야하는데어떻게하지?
보고서,기사,프레젠테이션에바로사용해도손색없는결과물을이책으로만들어보자!
저자는“이책을집필할때바로실무에사용해도될수준의텍스트분석과정과시각화과정을포함하기위해노력했다.”고강조한다.현장에서일하고강의하면서만난후배와수강자가꼽은국내텍스트마이닝학습콘텐츠의가장아쉬운점이‘학습과실제업무의괴리가크다’였기때문이다.이책은그런지점을완벽하게해소하고있다.한글데이터를다루는텍스트분석과정은실무에가까운수준이고,분석결과로만드는시각화자료는내일당장보고서,신문기사,프레젠테이션등에사용해도손색없는수준이다.
저자는당신이어디에서어떻게어려워할지다알고있다!
저자가옆에앉아친절하게설명해주는문장으로감동받으며공부하자!
텍스트분석과정은가시밭길이다.어디에서어떤문제가벌어질지모르기때문이다.하지만저자는이런과정을학습자ㆍ강의자입장에서모두겪어본베테랑중의베테랑이다.본문을읽다보면저자가옆에앉아서“여기는아마헷갈릴텐데이렇게하면쉽게이해할수있을겁니다.”라고말해주는느낌을받을것이다.또한본문을읽다가궁금해할만한내용이나,지금당장몰라도되지만결국은알아야할내용은본문중간중간에‘꿀팁’,‘알아두면좋아요’로풍부하게배치했다.
베타테스터후기
한국어텍스트분석,이책한권만보면됩니다!
텍스트분석에관심이많아출간도서와온라인콘텐츠를대부분학습했고,값비싼교육프로그램도수강했습니다.그런데도늘아쉬움이많았습니다.기존의텍스트분석콘텐츠는대부분영어로된자료를바탕으로만들어진것이었고,코드설명이상세하지않았기때문입니다.코드를활용하려고해도이론설명이부족하여항상아쉬었습니다.그런데이책의알파테스터로참여하면서‘앞으로이책의독자는이런아쉬움은없겠구나’하는확신이생겼습니다.감히‘텍스트분석최고의책’이라고추천합니다.여러분은그저편안한마음으로차근차근따라가기만하면됩니다.한국어텍스트분석은이제이책으로시작하고,끝내세요.
-기업에서인공지능과데이터교육을담당하는분석꿈나무_조영찬
R을1도모르는R린이도할수있어요!
내년대선댓글분위기분석은제손으로직접해봐야겠어요!
R을1도모르던R린이가바로저였는데요.저자선생님의《Doit!쉽게배우는R데이터분석》으로R입문을마친다음데이터마이닝에겁없이도전해봤습니다.그리고책을읽고나서데이터분석으로정말많을것을할수있다는점을알고무척놀랐습니다.평소에접했던뉴스나기사내용을분석하니오즈비,로그오즈비와같은개념도이해하는데크게어렵지않았어요.이책덕분에정말재미있고즐겁게공부했습니다.나중에는제가직접대선후보댓글을분석해봐야겠어요!
-R의매력에빠진애독자_선명환
텍스트마이닝이라는표현때문에무작정어렵게만생각했는데...
실제사례에적용하며공부하니술술이해가됐어요!
평소에데이터분석에관심이많아서‘텍스트마이닝’이라는표현을쉽게접할수있었는데요.표현이주는무게때문인지어렵게만느껴져데이터분석기초공부만하고차마손대지못하고있었습니다.그런데‘기생충오스카수상소식댓글분석’,‘대통령연설문분석’,‘타다금지법댓글분석’과같은현실사례를놓고공부할수있다고하니우선뛰어들수있었어요!조금어려운내용도실제사례로설명하니가깝게느껴져서개념을더쉽게이해할수있었습니다.무엇보다본문구성이텍스트마이닝의절차를순서대로잘배치해서친절하게알려준다는느낌을받아좋았습니다.
-텍스트마이닝이무서웠던R린이_김영준

국내최고의텍스트데이터분석비법이담긴책!
국내최고의텍스트데이터분석비법이담긴책입니다.이책을보는내내빅데이터전문가가된기분이들었습니다.아주쉬운설명으로텍스트마이닝의데이터분석과정을술술진행할수있었고,결과물도다양해서학습만족도가무척높았습니다.책에나온설명을읽으면서코드를그대로따라가니SNS부터기사댓글까지텍스트를분석할수있는능력을얻을수있었습니다.앞으로만날무수히많은텍스트데이터도잘분석할수있을것같네요.여러분도직접텍스트마이닝을경험해보세요!
-데이터분석가를꿈꾸며하루하루공부하는대학생_이동훈

R텍스트마이닝특별과정을한권으로배울수있어요!
《Doit!쉽게배우는R데이터분석》을공부하면서‘텍스트마이닝’과정을알게되었다면이책1독을강력추천하고싶습니다.이책은텍스트마이닝에서꼭공부해야할형태소분석,TF-IDF,감정분석,토픽모델링등과같은기초이론부터실제데이터를활용한텍스트분석프로젝트까지경험하게해줍니다.책을덮고나면텍스트마이닝을제대로할줄아는데이터분석가가되어있을것입니다.오늘도데이터분석하느라고생하셨습니다!:D
-공공빅데이터청년인턴_김성범

-이런사람이읽으면좋아요
-데이터분석을R로입문한사람(〈〈Doit!쉽게배우는R데이터분석〉〉을1독한사람)
-호기심반,진심반으로우리주변의다양한텍스트를실제로분석해보고싶은사람
-텍스트마이닝을현업에어떻게적용해야할지막막한예비실무자
-데이터분석에관심이많은대학교3,4학년학부생
-이지스퍼블리싱이선사하는독자지원
공부하다막히면바로바로참고하자!저자운영깃허브
-깃허브:github.com/youngwoos/Doit_textmining
이책의독자들과함께공부하고책선물도받아가세요!
-두잇스터디룸(책질문환영):cafe.naver.com/doitstudyroom
기술관련질문은저자가직접운영하는페이스북그룹에하세요!
-저자질문(기술질문):www.facebook.com/groups/datacommunity