파이썬으로 데이터 주무르기 (독특한 예제를 통해 배우는 데이터 분석 입문)

파이썬으로 데이터 주무르기 (독특한 예제를 통해 배우는 데이터 분석 입문)

$29.08
Description
독특한 예제를 통해 배우는 데이터 분석 입문
이 책은 누구나 한 권 이상 가지고 있을 파이썬 기초 문법책과 같은 내용이 아닌, 데이터 분석이라는 특별한 분야에서 초보를 위해 처음부터 끝까지 파이썬으로 진행되는 과정을 다룹니다. 서울시 범죄 현황 분석, 셀프 주유소 가격 정보 분석, 19대 대선 결과 분석 등 흥미 있는 목표를 이루기 위해서 파이썬의 기초를 익히고, 데이터를 다루고 분석하는 데 필요한 과정을 대화 형식으로 전개하면서 필요한 기초 내용은 그때 그때 습득하고자 합니다. 마치 파이썬에 대해 잘 모르는 독자가 구글에서 검색하며 코드 한 줄 한 줄을 완성해가는 느낌으로 기술했습니다.

대부분의 장에는 뚜렷한 목표가 있습니다. 항상 시작은 데이터를 얻는 법을 먼저 다루게 되고, 그 데이터를 정제하거나 변경해가며 목표를 이루는 과정을 보여줍니다. 필요하다면 해당 모듈의 튜토리얼을 가지고 와서 기초를 설명하고자 합니다. 아마 이 책을 다 읽고 나면 파이썬이, 또 파이썬으로 수행하는 데이터 분석의 세계가 아주 흥미롭다는 것을 알게 될 것입니다.
저자

민형기

저자민형기는국립창원대학교제어계측공학과에서제어공학을전공하고공학박사학위를받았다.엔티렉스로봇연구소소장,미래컴퍼니수술로봇연구소책임연구원등을역임했고,국가직무능력표준(NCS)중에서로봇인공지능/기계하드웨어학습모듈개발에참여했다.군사용로봇,수술용로봇,3D프린터,스마트폰광학영상안정화(OIS)등다양한형태의로봇혹은제어기술개발에참여하면서,로봇이수집한다양한데이터를분석하는과정을다수경험했다.일상생활의질문을데이터분석을통해직접확인하는것이취미이며,현재로봇부터데이터과학까지다루는블로그(http://pinkwink.kr)를운영하고있다.최근에는작은스타트업인로봇앤모어의수석연구원으로서재미있는로봇에대한연구개발을수행하고있다.

목차

1장서울시구별CCTV현황분석
1-1CCTV현황과인구현황데이터구하기
1-2파이썬에서텍스트파일과엑셀파일을읽기pandas
1-3pandas기초익히기
1-4pandas를이용해서CCTV와인구현황데이터파악하기
1-5pandas고급기능두DataFrame병합하기
1-6.CCTV데이터와인구현황데이터를합치고분석하기
1-7파이썬의대표시각화도구Matplotlib
1-8CCTV현황그래프로분석하기

2장서울시범죄현황분석
2-1데이터획득하기
2-2pandas를이용하여데이터정리하기
2-3지도정보를얻을수잇는GoogleMaps
2-4GoogleMaps를이용해서주소와위도,경도정보얻기
2-5pandas의pivot_table학습하기
2-6Pivot_table을이용해서데이터정리하기
2-7데이터표현을위해다듬기
2-8좀더편리한시각화도구Seaborn
2-9범죄데이터시각화하기
2-10지도시각화도구Folium
2-11서울시범죄율에대한지도시각화
2-12서울시경찰서별검거율과구별범죄발생율을동시에시각화하기

3장시카고샌드위치맛집분석
3-1.웹데이터를가져오는BeautifulSoup익히기
3-2크롬개발자도구를이용해서원하는태그찾기
3-3실전:시카고샌드위치맛집소개사이트에접근하기
3-4.접근한웹페이지에서원하는데이터추출하고정리하기
3-5다수의웹페이지에자동으로접근해서원하는정보가져오기
3-6JupyterNotebook에서상태진행바를쉽게만들어주는tqdm모듈
3-7상태진행바까지적용하고다시샌드위치페이지50개에접근하기
3-850개웹페이지에대한정보가져오기
3-9맛집위치를지도에표기하기
3-10네이버영화평점기준영화의평점변화확인하기
3-11영화별날짜변화에따른평점변화확인하기

4장셀프주유소는정말저렴할까
4-1Selenium사용하기
4-2서울시구별주유소가격정보얻기
4-3.구별주유가격에대한데이터의정리
4-4.셀프주유소는정말저렴한지boxplot으로확인하기
4-5.서울시구별주유가격확인하기
4-6.서울시주유가격상하위10개주유소지도에표기하기

5장우리나라인구소멸위기지역분석
5-1목표명확히하기
5-2인구데이터확보하고정리하기
5-3인구소멸위기지역계산하고데이터정리하기
5-4.대한민국지도그리는방법에대한소개
5-5.지도시각화를위해지역별고유ID만들기
5-6.Cartogram으로우리나라지도만들기
5-7.인구현황및인구소멸지역확인하기
5-8.인구현황에서여성인구비율확인하기
5-9.Folium에서인구소멸위기지역표현하기

6장19대대선결과분석
6-1Selenium과BeautifulSoup을이용한데이터획득준비작업
6-219대대선개표결과데이터획득하기
6-3각후보의득표율과지역ID정리
6-4.19대대선결과득표율시각화하기

7장시계열데이터를다뤄보자
7-1.Numpy의polyfit으로회귀(regression)분석하기
7-2.Prophet모듈을이용한forecast예측
7-3.Seasonal시계열분석으로주식데이터분석하기
7-4.GrowthModel과HolidayForecast

8장자연어처리시작하기
8-1한글자연어처리기초-KoNLPy및필요모듈의설치
8-2한글자연어처리기초
8-3워드클라우드
8-4육아휴직관련법안에대한분석
8-5NaiveBayesClassifier의이해영문
8-6NaiveBayesClassifier의이해한글
8-7문장의유사도측정하기
8-8여자친구선물고르기

출판사 서평

이책의특징
-Pandas,Matplotlib,numpy,folium,KoNLPy,BeautifulSoup,Selenium등데이터분석과시각화에필요한많은모듈을다룬다.
-정확한목표를가진실제프로젝트를다수수행하면서프로젝트단위로데이터분석을학습할수있다.
-Python이처음인독자라도프로젝트를수행할수있도록설명한다.

이책이필요한독자
-Python을공부했지만실제로어디에어떻게적용하는지궁금한독자
-데이터분석을통해얻을수있는결과를학습과동시에경험하고싶은독자
-프로그래밍언어가처음이지만단기간에성과를얻고싶은독자

대상독자
초중급

소스코드
https://github.com/bjpublic/DataScience

인터넷에서데이터를얻어서원하는형태로가공하고결론을얻는과정은최근데이터과학이라는이름으로광범위하게인기를얻고있습니다.실제로꼭빅데이터가아니라도방대한인터넷의자료를정리하기위해서도필요한기술들입니다.예전에는전문분야에서만사용되던기술이이제는급격하게일반에확장되어가고있습니다.인터넷의발전과함께앞으로도계속관심을받을분야일것입니다.
이책은Python문법입장에서는정말기초적인부분을학습하지만,데이터분석이목표인사람들을타겟으로서울시범죄현황분석,셀프주유소가격정보분석,19대대선결과분석등의흥미있는목표를통해텍스트,엑셀파일부터웹데이터까지데이터를획득하고이를가공해서표현하는기술을익힙니다.더나아가회귀,분류등한단계높은수준의데이터분석기술까지학습할수있게될것입니다.