파이썬(Python) 2학년 스크래핑의 구조 (체험으로 배우고! 대화 형식으로 공부!)

파이썬(Python) 2학년 스크래핑의 구조 (체험으로 배우고! 대화 형식으로 공부!)

$17.82
Description
데이터 수집이나 해석, 분석에 대해 알기 쉽게 설명!
파이썬은 인공지능의 기초 언어로 배우기 쉬우면서 각종 데이터 분석에 사용되는 프로그래밍 언어로 절정의 인기를 누리고 있다. 기존이 파이썬 책이 선뜻 입문하기 어려운 감이 있었다면 이 책은 염소 박사와 강아지 다솜 양의 친근한 일러스트를 도립해 책 전체가 쉬워보이며 실제로도 코드 설명이나 설치법, 버튼 안내가 큼직큼직한 주제의 만화와 대화체 방식으로 구성하여 매우 쉽게 느껴진다.

인터넷에 공개된 데이터를 수집하는 일을 ‘크롤링(Crawling)’, 이 데이터를 해석해 필요한 데이터를 구하는 일을 ‘스크래핑(Scaping)’이라고 하는데, 파이썬은 인터넷에 액세스할 수 있는 라이브러리가 풍부해 이 두가지 모두 쉽고 편하게 할 수 있는 언어로 널리 알려져 있다. 이 책에서는 스크래핑을 하는 라이브러리 ‘Beautiful Soup4’아 데이터를 분석하는 라이브러리 ‘판다스(pandas)’를 사용해 실제로 파이썬의 핵심 기능에 접근할 수 있도록 한다.

1학년 시리즈 중 독보적인 인기를 누렸던『파이썬 1학년』의 인기에 힘입어 『파이썬 2학년 데이터 분석 구조』가 나왔고 이 책이 원서로는 2학년 시리즈중 먼저 나왔으나 번역자 이영란 박사가 국내 사정에 맞게 코드나 사이트를 정리하여 이번에 선보이게 되었다.

이 책의 예제 코드와 함께 홈페이지 회원들에게만 제공하는 회원특전 PDF는 예제와 라이브러리 사용법 간이 매뉴얼로 성안당 홈페이지(www.cyber.co.kr) [도서몰]에 회원가입 후 [자료실]-[자료실] 바로가기에서 도서 검색을 통해 다운로드할 수 있다.
저자

모리요시나오

앱개발,기술서와전자공작매거진등의집필활동및간사이학원대학강사,간사이학원고등부강사,세이안조형대학강사,오사카예술대학강사,프로그래밍스쿨코프리(コプり,kopuri.com)강사등프로그래밍에대한폭넓은활동을펼치고있다.저서로는『즐겁게배우는Unity2D초입문강좌』(마이나비출판),『움직이고배우다Vue.js개발입문』,『Java1학년』,『Python1학년』(이상쇼에이사),『즐겁게배우는알고리즘과프로그래밍도감』(마이나비출판)등이있다.

목차

들어가며
이책의예제테스트환경며
이책의대상독자와2학년시리즈에대해
이책을보는법
예제파일과회원특전PDF의다운로드에대해


제1장파이썬으로데이터를다운로드
LESSON01스크래핑이뭘까?
크롤링과스크래핑
주의해야할점도있다
robots.txt란?

LESSON02파이썬을설치해보자
윈도에설치하는방법
macOS에설치하는방법

LESSON03requests로액세스해보자
라이브러리설치방법
HTML파일을읽어들이는프로그램
IDLE을시작하자
프로그램을만들어보자
텍스트파일에쓰기:open,close
텍스트파일에쓰기:with문

제2장HTML을해석해보자
LESSON04HTML을해석해보자
BeautifulSoup설치하기
BeautifulSoup로해석하기
태그를찾아표시하기
모든태그를찾아표시하기
id나class로검색범위좁히기

LESSON05최신뉴스기사목록을구해보자
디벨로퍼툴을사용해범위를좁히자

LESSON06링크목록을파일로출력해보자
모든링크태그의href속성표시하기
모든링크태그의href속성을절대URL로표시하기
링크목록자동작성프로그램

LESSON07이미지를한꺼번에다운로드해보자
이미지파일을읽어들여저장하기
다운로드용폴더를만들어저장하기
모든img태그의이미지파일URL을표시한다
페이지안이미지를한꺼번에다운로드하는프로그램

제3장표데이터를읽고쓰자
LESSON08pandas를사용해보자
pandas설치하기
표데이터란?
CSV파일읽어들이기
열,행데이터표시하기
열,행데이터추가하기
열,행데이터삭제하기

LESSON09다양한데이터가공
필요한정보추출하기
데이터집계하기
데이터정렬하기
행과열바꾸기
CSV파일로출력하기

LESSON10그래프로표시해보자
matplotlib설치하기
그래프로표시하기
다양한종류의그래프표시하기
개별데이터를그래프로표시하기
막대그래프를이미지파일로출력하기

LESSON11엑셀파일을읽고써보자
openpyxl설치하기
엑셀파일로출력하기
엑셀파일읽어들이기

제4장오픈데이터를분석해보자
LESSON12오픈데이터란?
오픈데이터는보물섬

LESSON13우체국:우편번호데이터
CSV파일읽어들이기
데이터추출하기

LESSON14e-나라지표:국정모니터링지표
CSV파일읽어들이기
데이터를그래프로표시하기

LESSON15기상자료개방포털:기상청날씨데이터서비스
CSV파일읽어들이기
데이터를그래프로표시하기

LESSON16공공데이터포털:지방자치단체데이터
CSV파일(소방서)읽어들이기
folium설치하기
소방서를지도에표시하기
CSV파일(음식점)읽어들이기
가게를지도에표시하기

제5장웹API로데이터를수집하자
LESSON17웹API란?
다른컴퓨터의기능이용하기

LESSON18OpenWeatherMap이란?
OpenWeatherMap사이트이용순서
OpenWeatherMap이용하기

LESSON19현재날씨를조사하자
도시명을지정해날씨알아보기
JSON이란?
JSON데이터형식
JSON데이터를읽어들이는방법
우편번호를지정해날씨알아보기

LESSON20오늘부터5일동안(3시간간격)의날씨알아보기
5일동안의날씨를구해보자
UTC(협정세계시)를KST(한국표준시)로변환
5일동안의기온을그래프로표시해보자
한걸음더

찾아보기

출판사 서평

머신러닝(기계학습)이나데이터를분석하는데반드시필요한‘데이터’는인터넷상에방대하게퍼져있지만파이썬을사용하면효율적으로수집할수있다.이러한방법을‘스크래핑’이라고합니다.
파이썬을대략적으로알고계신분들이간단한샘플을만들어보며대화형식으로스크래핑의구조를배울수있습니다.

■대상독자
●파이썬의기본문법을알고있는분(『파이썬1학년』을다읽으신분)
●데이터수집이나데이터분석초보자

■2학년시리즈의포인트셋
●포인트(1)기초지식을알수있다
각장의첫부분에만화나일러스트를넣어서각장에서배울내용을소개합니다.그이후는일러스트를섞어가며기초지식에대해설명합니다.

●포인트(2)프로그램의구조를배운다
필요한문법을최소한으로선별하여중간에포기하지않도록주로대화형식을통해알기쉽게설명합니다.

●포인트(3)개발체험을할수있다
프로그래밍언어(애플리케이션)초보자들도재미있게배울수있도록다양한예제를마련했습니다.

■이책의포인트
염소박사님,다솜양과함께인터넷에서파일을다운로드하는방법,HTML을해석하는방법,여러데이터를읽고쓰기,‘API의사용법’으로불리는데이터수집,편리한라이브러리를이용한간단한가시화방법을알아봅니다.