R을 이용한 웹 크롤링과 텍스트 분석

R을 이용한 웹 크롤링과 텍스트 분석

$25.36
Description
통계분석 시각화능력을 키우기
〈R을 이용한 웹 크롤링과 텍스트 분석〉은 R-Studio를 활용하여 기본적인 통계분석, 시각화 하는 기초능력을 키우는 데 도움을 준다. 이 책은 웹 크롤링을 통해 데이터를 수집하고 R을 이용해 텍스트를 분석하는 R 강의 교재로 활용될 수 있다.

R을 이용한 텍스트마이닝은 대용량 텍스트를 분석하는 도구로, 대용량 텍스트로부터 유용한 정보를 추출한다. 텍스트마이닝은 뉴스, 소셜미디어, 논문 등을 분석해 현상을 이해하고, 이론을 검증하는데 목적이 있다. 〈R을 이용한 웹 크롤링과 텍스트 분석〉은 실행과정에서의 오류를 최소화하기 위해 웹 크롤링과 텍스트 분석 처리기법들을 최신 버전으로 실행한 결과를 제시하고 있다.

1장, 2장은 R 프로그램의 기본 원리를 이해할 수 있도록 구성되어 있다. 3장은 R 프로그램의 기초 사용법을 익힐 수 있게 하고, 4장으로 기본적인 객체지향형 데이터 구조를 이해할 수 있다. 5장의 R기초통계는 통계의 이론적인 접근과 더불어 데이터에 대한 기술통계량과 중급통계를 실행할 수 있는 능력을 끌어올릴 수 있게 하고, 6장에서는 다양한 데이터를 그래프로 표현하여 시각화 하고, 데이터에 나타난 현상과 이론적 패턴을 찾아내는 방법을 학습한다. 이 책의 핵심은 7장의 R을 이용한 웹 크롤링과 8장의 텍스트 분석이다. 그렇기 때문에 이 책은 다양한 문서를 스크렙핑 또는 크롤링하는 역량을 익힐 수 있도록 많은 사례를 포함하고 있다.

저자는 R의 동향을 파악하고 상용 프로그램과 연결하는 연구를 통해 연구결과를 저널에 발표해왔다. 저자는 초기 R수용과정 경험을 이 책에 반영하고자 노력해왔다. 인공지능 시대, 머신러닝이 중요해진 이 시기에 〈R을 이용한 웹 크롤링과 텍스트 분석〉이 머신러닝 알고리즘 구현과 텍스트분석을 해내는 학생들을 양성하고 더 나아가 인공지능 연구에 기여가 되기를 기대한다.
저자

권상희

성균관대미디어커뮤니케이션학과교수
텍스트분석,AI미디어와이론,사이버커뮤니케이션,텔레커뮤니케이션,커뮤니케이션이론을주로연구하고있다.서울대학교언론정보학과에서학사,캘리포니아주립대Radio-Television-Film학과에서석사,남일리노이대에서MassCommunication&MediaArts로박사를마쳤다.(주)삼성전자홍보실과아칸사스주립대신문방송학과에조교수로재직했으며,캠브리지대에서연구년을보냈다.역서로〈노드엑셀을이용한소셜네트워크분석〉〈사이버커뮤니케이션이론〉,〈아나운싱:디지털시대방송커뮤니케이션〉와저서로〈커뮤니케이션통계분석론〉〈컨버전스와미디어의세계〉,〈디지털미디어와사회〉주요연구로AI발달연구,빅(big)데이터프레임,창조경제보도의제설정,소셜뷰잉,상호작용차원연구,미디어적소연구,인터넷미디어뉴스형식연구,인터넷발달보도프레임연구,뉴할리우드영화의포스트모더니즘연구,인터넷광고효과모형,온라인저널리즘기사구성방식비교,생명공학보도경향연구등이있다.소통학회회장역임,현인터넷융합학회회장과AI와미디어포럼운영을하고있다.

목차

머리말

Chapter1R프로그램설치및환경설정
1.1R소개
1.2R프로그램설치하기
1.3R프로그램의구성
참고문헌

Chapter2R-Studio프로그램설치및환경설정
2.1R-Studio소개
2.2R-Studio설치하기
2.3RStudio프로그램실행하기
2.4R-Studio프로그램의환경설정하기
2.5R-Studio프로그램의기초활용
참고문헌

Chapter3R기초사용법
3.1기초사용법
3.2연산자소개
3.3데이터유형
참고문헌

Chapter4데이터종류및활용
4.1데이터형태
4.2외부데이터읽어오기
4.3데이터추출하기
4.4데이터합치기
참고문헌

Chapter5기초통계
5.1기초통계및T-test
5.2분산분석
5.3회귀분석
참고문헌

Chapter6그래프사용및데이터시각화
6.1일변량범주형자료시각화
6.2일변량연속형자료시각화
6.3이변량범주형자료시각화
6.4이변량연속형자료시각화
6.5기타그래프
참고문헌

Chapter7웹(web)크롤링이론과실습
7.0웹(web)스크래핑이해하기
7.1커뮤니티게시판본문수집예제
7.2커뮤니티댓글수집예제
7.3대형포털쇼핑상품정보,평점,리뷰수집예제
7.4모바일네이버카페본문수집예제
7.5PC네이버블로그본문수집예제
7.6PC네이버뉴스본문,반응수,댓글수집예제
참고문헌240

Chapter8텍스트분석
8.1텍스트분석의정의와데이터처리
8.2텍스트분석을위한전처리학습
8.3뉴스데이터수집과분석
8.4텍스트분석및결과제시
8.5기계학습을통한텍스트분석
참고문헌

참고문헌및추천자료
색인