LUVIT 폴라스로 시작하는 데이터 분석 (영화와 음악 데이터를 활용한 EDA부터 시각화, 인사이트 도출까지)

LUVIT 폴라스로 시작하는 데이터 분석 (영화와 음악 데이터를 활용한 EDA부터 시각화, 인사이트 도출까지)

$28.00
Description
복잡한 분석을 더 빠르게, 더 간결하게 Pandas를 뛰어넘는 분석 도구 Polars
대용량 데이터에서 팬더스(Pandas)의 성능과 표현력의 한계를 체감하는 데이터 분석가가 점점 늘고 있다. 이 책은 파이썬 기반 데이터 분석의 새로운 대안인 폴라스(Polars)를 중심으로 어떻게 더 빠르고 간결한 분석이 가능한지를 실제 사례를 통해 안내한다. 한국 박스오피스 데이터를 활용한 영화 흥행 분석부터 스포티파이 데이터를 통한 로제의 〈APT.〉, BTS, 테일러 스위프트 등 글로벌 음악 데이터 분석 및 트렌드 파악까지 현실적인 분석 시나리오를 통해 폴라스의 빠른 성능을 직접 확인할 수 있도록 구성했다. 팬더스와의 비교를 통해 실행 속도와 메모리 효율, 코드 표현력의 변화를 살펴보고, 지연 평가와 병렬처리, 타입 안정성 등 폴라스의 핵심 개념을 실습 중심으로 풀어낸다. 복잡한 분석을 더 명확하고 안전하게 구현하고 싶은 독자에게 팬더스 이후의 현실적인 선택지를 제시한다.
저자

이기준

한국항공대학교에서컴퓨터공학으로박사학위를받았다.한국교육개발원(KEDI)에서국가교육통계데이터의디지털화를시작으로20여년간국가교육통계데이터조사,관리,분석과서비스시스템의기획,개발,운영,관리의전분야를실무부터총괄까지수행했다.KEDI에서교육통계센터소장및국가교육통계연구본부장등을역임했고,미국보이시주립대학교교육공학과에서연수했다.한국항공대학교,극동대학교등에서강의했고,현재학생수,유아수등의교육데이터예측업무를수행하고있다.저서로2022년세종도서학술부문우수도서에선정된《실전에서바로쓰는시계열데이터처리와분석inR》(제이펍,2021),《Plotly로시작하는인터랙티브데이터시각화inR&파이썬》(제이펍,2023)이있고,공저로《메타버스유니버시티》(동문사,2023)가있다.

목차

머리말viii
베타리더후기x
이책을읽는법xii
학습가이드xvi
로드맵xviii

PART1데이터로세상을읽는시대
CHAPTER1데이터사이언스란?
1.1데이터사이언스프로세스4
1.2데이터사이언스도구16
1.3빅데이터생태계이해하기23
돌아보기/쪽지시험29

CHAPTER2파이썬이란?
2.1파이썬들어가기31
2.2파이썬설치와파이썬사용도구32
2.3파이썬데이터다루기:팬더스의기초41
2.4팬더스의한계48
돌아보기/쪽지시험50

PART2폴라스들여다보기:빠르고거대한데이터분석도구
CHAPTER3폴라스란?
3.1폴라스의목표54
3.2폴라스의구조56
3.3폴라스의특징59
3.4팬더스vs.폴라스62
돌아보기/쪽지시험66

CHAPTER4폴라스깊이있게배우기
4.1폴라스설치68
4.2폴라스데이터타입69
4.3폴라스데이터구조74
4.4표현식78
4.5콘텍스트102
4.5지연연산107
돌아보기/쪽지시험113

PART3데이터로보는영화:영화속에담긴데이터
CHAPTER5처음만나는영화데이터,구조부터살펴보기
5.1영화의흥행성적표살펴보기118
5.2다양한방식으로영화데이터가져오기121
5.3다양한형식으로영화데이터프레임바꿔보기134
5.4영화데이터로데이터프레임구조들여다보기139
5.5데이터를이루는열정보확인하기145
돌아보기/쪽지시험149

CHAPTER6폴라스데이터프레임으로영화데이터만져보기
6.1영화데이터프레임전체흐름잡기151
6.2열로영화정보정리하고가공하기155
6.3다양한필터링방법으로영화데이터골라내기169
6.4영화데이터를그룹별로묶어분석하기182
돌아보기/쪽지시험199

CHAPTER7폴라스데이터프레임으로영화데이터구조바꾸기
7.1데이터프레임조인으로분리된영화데이터연결하기201
7.2데이터프레임연결로영화데이터이어붙이기214
7.3데이터프레임피벗과언피벗으로영화데이터구조바꾸기218
돌아보기/쪽지시험224

CHAPTER8폴라스로영화데이터생생하게그리기
8.1폴라스시각화의특징알아보기226
8.2폴라스로손쉽게데이터시각화하기227
8.3영화데이터를시각적으로풍부하게표현하기231
8.4폴라스표로영화데이터정확하게시각화하기256
돌아보기/쪽지시험281

PART4데이터로듣는음악:음악속에담긴데이터
CHAPTER9스포티파이음악데이터를탐색적으로분석하기
9.1스포티파이음악데이터셋준비하기286
9.2EDA를위한데이터준비하기289
9.3파생데이터만들기296
돌아보기/쪽지시험302

CHAPTER10스포티파이음악데이터로인사이트도출하기
10.1스포티파이숫자데이터로국가별인기도분포분석하기304
10.2수치형변수간상관관계와회귀분석하기320
10.3스포티파이데이터로글로벌인기도파악하기326
돌아보기/쪽지시험343

용어집345
찾아보기349

출판사 서평

같은데이터를더빠르게분석하는방법
이책은실제데이터를다루는분석과정속에서폴라스의장점을보여줍니다.영화박스오피스데이터를바탕으로〈파묘〉,〈범죄도시4〉,〈인사이드아웃2〉등의사례를통해흥행흐름을살펴보고,로제의〈APT.〉를포함한스포티파이데이터를활용해음악트렌드를분석합니다.같은데이터를사용하더라도분석속도와코드구조가어떻게달라지는지를직접확인하며,폴라스가왜더빠르고간결한분석을가능하게하는지자연스럽게이해하도록구성했습니다.

이책만의특별한점
폴라스는빠르지만낯선도구입니다.이책은그낯섦을줄이는데서출발합니다.처음부터모든개념을이해하려애쓰지않아도데이터를불러오고정리하고계산하는과정을따라가다보면폴라스의사용방식과장점이자연스럽게드러나도록구성했습니다.설명을먼저읽고외우기보다코드를실행하고결과를확인하면서'이렇게달라지는구나'를체감하는데초점을맞췄습니다.덕분에새로운분석도구에부담을느끼는독자도흐름을놓치지않고끝까지따라갈수있습니다.
1.결과보다흐름을이해하는데이터분석
이책은'빠르다'는결론을먼저보여주지않습니다.데이터를불러오고,정리하고,계산하고,다시가공하는흐름속에서폴라스의처리방식이어떻게차이를만드는지를단계별로살펴봅니다.
2.실무에가까운데이터로진행하는분석
교과서용예제가아니라실제로분석해볼만한영화및음악데이터를사용합니다.도구학습에그치지않고,데이터분석의맥락을함께이해할수있습니다.
3.팬더스와나란히놓고비교하는접근
익숙한팬더스방식과폴라스의접근법을함께살펴보며,실행속도와메모리사용,코드구조의차이를직접확인합니다.단순한문법비교가아니라분석방식이어떻게달라지는지를중심으로설명합니다.
4.대용량데이터를염두에둔설계관점
지연평가,병렬처리,타입안정성같은폴라스의핵심개념을실제분석흐름속에서다룹니다.데이터규모가커질수록왜이런구조가필요한지를자연스럽게연결합니다.

이책은누가읽으면좋을까요?
●파이썬기초가있고데이터분석에입문하고자하는독자
●팬더스를사용해왔으나성능한계를느낀독자
●실무에서탐색적데이터분석을수행하고자하는독자

이책에서다루는내용은무엇인가요?
●폴라스개념과팬더스와의차이점비교
●폴라스설치및데이터프레임구조이해
●표현식기반API의개념과활용법
●지연실행과성능최적화기법
●그룹화,피벗,조인,필터링등주요기능실습
●Plotly를활용한데이터시각화
●다양한파일포맷및외부데이터연결실습
●실전프로젝트:영화및음악데이터로포트폴리오만들기