웹 크롤링 & 데이터 분석 with 파이썬

웹 크롤링 & 데이터 분석 with 파이썬

$20.22
Description
인터넷 정보를 요리하는 자동화 기술, 웹 크롤링!
내가 좋아하는 스포츠 팀의 성적 데이터를 자동으로 가져와 분석해 봅시다. 최근에 부동산 가격이 올라가는 지역이 어딘지 궁금하다면 공공 사이트에서 데이터를 가져와 분석해 봅시다. 주식 정보는 어떤가요? 매일 변동하는 주가를 데이터베이스에 저장했다가, 필요할 때마다 그래프 형태로 불러와 변동 추이를 살펴보는 것도 재미있지 않을까요?

처음 만나는 웹 크롤링 입문서
인터넷 정보를 나의 필요나 업무의 요구에 맞게 불러오고 가공하고 자동화하는 모든 것들이 다 웹 크롤링이라는 IT 기술을 기반으로 합니다. 이 책은 웹 크롤링 기술에 대한 안내서이자 입문서입니다. 그동안 파이썬이라는 언어와 크롤링의 난해한 코드로 고개를 떨구던 독자에게, 크롤링 기술은 누구나 쉽게 배울 수 있다는 것을 알려주는 책입니다.

세 가지 기본 기술만 알면 웹 크롤링이 내 손 안에
웹 크롤링은 세 가지 기본 개념과 방법만 손에 익히면 입문자도 충분히 구현할 수 있는 기술입니다. BeautifulSoup 라이브러리를 이용한 파싱, 동적 웹 페이지를 다루는 Selenium 라이브러리, 그리고 오픈 데이터를 활용하는 API 기술이 그것입니다. 다만 이 기술을 제대로 아는 게 중요합니다. 이 책은 입문자도 쉽게 따라올 수 있도록 기초부터 차근차근 크롤링 기술의 개념과 방법을 단계적으로 학습하도록 돕습니다. 파이썬을 전혀 모른다고요? 크롤링 학습에 꼭 필요한 내용 중심으로 공부하도록 안배하였습니다.

크롤링은 물론 데이터 분석까지
더 나아가 이 책에서는 크롤링한 데이터를 활용하는 여러 가지 방법도 함께 배웁니다. 데이터를 제대로 가져왔어도 내 업무에 맞게 변형할 수 없다면 모두 무용지물입니다. CSV 파일이나 엑셀 파일로 저장하기, 판다스 라이브러리의 데이터 프레임 형태로 변환하기, MySQL 데이터베이스 형태로 저장하기, 데이터를 시각화하기 등 크롤링한 데이터를 내 입맛에 맞게 변환하는 다양한 기법도 함께 배우게 됩니다.
저자

장철원

공부한내용을기록하고나누는것을좋아하는프리랜서개발자.

충북대학교에서통계학을전공하고,고려대학교에서통계학석사로졸업했다.이후플로리다주립대학교(FloridaStateUniversity)통계학박사과정중에휴학하고취업전선에뛰어들었다.어렸을때부터게임을좋아해서크래프톤에입사했다.데이터분석실에서주로머신러닝을이용하여이탈률예측과고객분류업무를수행했다.배틀그라운드의핵관련업무를계기로IT보안에흥미를느꼈다.이후NHNIT보안실에서일하며머신러닝을이용한매크로자동탐지시스템을개발하고특허를등록했다.현재는머신러닝관련책을쓰면서강의와개발을병행하고있다.공부한내용을공유하는데보람을느껴블로그와카페를운영한다.관심분야는인공지능,머신러닝,통계학,선형대수,커널,임베디드,IT보안,사물인터넷,물리학,철학이다.저서로는《선형대수와통계학으로배우는머신러닝with파이썬》(비제이퍼블릭),《알고리즘구현으로배우는선형대수with파이썬》(비제이퍼블릭)이있다.

-프리랜서개발자
-한국정보통신기술협회외부교수
-패스트캠퍼스강사
-전)NHNIT보안실
-전)크래프톤데이터분석실

블로그https://losskatsu.github.io
네이버카페https://cafe.naver.com/aifromstat

목차

지은이의글

1편웹크롤링의핵심도구,파이썬쉽게배우기

1장웹크롤링에필요한환경을만들자!
파이썬소개
아나콘다설치하고가상환경설정까지

2장뚝딱뚝딱쉽게끝내는파이썬핵심문법
파이썬의기본자료형
조건문알아보기
반복문알아보기
예외처리
함수
모듈
패키지/라이브러리
클래스와객체

2편세가지만알면웹크롤링이내손안에

3장웹크롤링이란무엇인가?
웹크롤링의기초개념
웹페이지의뼈대,HTML기초
CSS맛보기
자바스크립트맛보기

4장꼭알아야할웹크롤링방법1-BeautifulSoup
BeautifulSoup라이브러리소개
첫번째웹크롤링실습
두번째웹크롤링실습
웹크롤링허용문제

5장꼭알아야할웹크롤링방법2-동적웹페이지
해외축구웹사이트둘러보기
동적웹페이지다루기
Selenium실습하기

6장꼭알아야할웹크롤링방법3-API
오픈API로부동산데이터크롤링하기
API사용하기

3편웹크롤링과데이터분석,활용

7장부동산웹크롤링과데이터분석도구
pandas로한눈에알아보는데이터만들기
matplotlib으로데이터시각화하기
pandas와matplotlib을활용한심화실습
파이썬으로CSV파일다루기
파이썬으로엑셀파일다루기

8장주식데이터웹크롤링과데이터베이스다루기
주식데이터웹크롤링은어떻게할까?
주식데이터크롤링
MySQL기초
파이썬으로MySQL에데이터추가하기
윈도우스케줄러를이용한자동화
파이썬으로MySQL데이터불러오기
주식데이터시각화