R과 Python을 활용한 비즈니스 애널리틱스

R과 Python을 활용한 비즈니스 애널리틱스

$41.69
Description
데이터 분석의 여정을 시작하려고 하는데 어디서부터 시작할지 모르겠다면 이 책은 당신에게 도움이 될 것이다. 이 책은 통계학부터 비즈니스에 적용할 수 있는 프로그래밍까지 모든 기초를 다루어 실제 비즈니스 분석을 수행할 수 있는 견고한 기초 지식을 제공한다. 본 책은 비즈니스 분석 및 예측 모델을 개발하는 원칙에 대한 입문 혹은 복습부터 시작해서 적용 방법에 대한 상세한 예시를 제공한다. 주요 통계 개념과 프로그램밍 기술 및 머신러닝 접근법을 소개하여 독자가 데이터 과학과 인공지능 시대에 모델을 설계하고, 개발하는 데 필수적인 기술을 갖출 수 있도록 도와준다. 이 책의 목표는 비즈니스 분석의 포괄적이고 일관된 기본 지식을 제공하여 학생들이 산업에 적합한 비즈니스 분석 및 모델을 설계, 개발 및 적용할 수 있도록 하는 것이다.

여러 해에 걸쳐, 저자진은 비즈니스 분석, 통계, 머신러닝 및 소프트웨어 시스템 응용에 대한 심층적인 전문 지식을 갖추어 왔다. 또한 비즈니스 분석, 머신러닝 및 인공지능에 대한 최첨단 연구를 수행해 왔으며, 분석과 머신러닝이 의사 결정과 사업 운영에 주요 역할을 하는 사업을 운영하고, 창업하며 비즈니스 감각을 유지하고 있다. 저자진은 선도 대학에서 비즈니스 분석, 금융 및 컴퓨터 공학의 다양한 강좌를 개발하고 가르쳤으며, 이러한 경험이 본 교재의 기반이 되었다.

비즈니스 분석은 정보 시대 핵심 역량으로써 글로벌 기업이 디지털 변혁을 추구하고 데이터 자원을 활용하여 경쟁 우위를 실현하고 있다. 이러한 비즈니스 분석은 의사 결정의 주요 요소로 비즈니스 통찰력, 프로그래밍 그리고 통계의 공통 분모이다. 그러나 비즈니스, 통계 혹은 프로그래밍 중 하나 이상의 분야에서 직접적인 경험이나 적절한 지식이 부족하여 비즈니스 분석에 어려움을 겪는 학생들이 많다. 많은 교재에서 통계를 수학적으로 깊게 다루는 것은 비즈니스 학생들에게는 불필요하며, 통계가 실제로 비즈니스 분석을 어떻게 주도하는지에 대한 확실한 개념적 이해가 중요한다. 또한 비즈니스에서 머신러닝이 급속하게 확산되고 있어 학생들은 이에 대한 기술적 이해 그리고 머신러닝이 전통적 통계와 어떻게 연결되는지 알아야 한다.

우리는 이 책이 비즈니스 분석 분야에 진입하려는 많은 학생들과 전문가들에게 접근성이 높아야 한다는 전제로 시작하였다. 따라서 이 책은 사전에 프로그래밍 경험이나 통계 지식이 없는 학생들도 이해할 수 있도록 만들었다. 전통적인 이론과 수학에 집중한 접근 방식으로는 이해하기 힘든 추상적이고 어려운 지식을 이 책은 코딩을 통한 학습 방법으로 풀어간다. 이처럼 비즈니스 실례를 통해 학생들이 실제 비즈니스 문제에 대한 자신만의 통계 및 머신러닝 접근법을 개발할 수 있도록 도와준다.

각 챕터마다 R과 Python 코딩 노트북이 제공되어 지식을 점진적으로 쌓을 수 있다. 실제 비즈니스는 점점 더 복잡해지고 있으며, 범위는 이윤 예측, 신용 불량/부도 예측, 사이버 위협 모니터링부터 벤처 캐피털 기반의 성과 모니터링까지 다양하다. 책의 대부분 챕터에서는 통계 및 머신러닝 개념과 프로그래밍 기술에 대한 능력과 자신감을 키우는 데 도움이 될 연습문제가 포함되어 있다.

이 책은 다음과 같이 구성되어 있다. 처음 네 챕터는 인기 있는 분석 오픈 소프트웨어인 R과 Python을 사용한 프로그래밍 기초를 소개하고 데이터 구조, 데이터 관리 및 조작, 데이터 시각화를 다룬다. 그 다음으로 챕터 5부터 7까지는 과도한 수학적 계산 없이 프로그래밍과 시각화를 통해 직관적인 통계 개념을 배운다. 이후 챕터 8부터 10까지는 기본 통계 검정을 설계하고 수행하는 방법을 배우며, 실제 비즈니스 응용 예제가 제공된다. 챕터 10은 캘리포니아 주의 요양원에 코로나 바이러스가 미친 영향을 조사하는 실제 사례를 다룬다. 챕터 11에서는 통계와 머신러닝 모델링의 핵심 구성요소인 추정에 대해 소개한다. 이는 고급 모델 설계의 기초가 되는 최대 우도 추정 원칙 개념을 다양한 예제와 함께 자세히 소개한다. 챕터12부터 15까지는 선형 모델, 일반 성형모델, 회귀 구조 및 진단, 시계열 분석과 같은 주제를 다룬다. 챕터 16부터 20까지는 응용 분석에서 가장 자주 사용되는 머신러닝 모델에 대해 다룬다.

책 전체를 통틀어서 R과 Python 코드 예제를 제공한다. 관심 있는 언어에 집중할 수 있도록 두 언어는 배경색으로 구분된다. 이 책은 한 언어에만 관심 있는 사람에게도 도움이 되지만, 우리는 두 언어에 대한 능력을 갖추는 것이 학생들에게 득이 될 것이라고 믿는다. 일부 기술은 한 언어에서 구현하기 쉽고, 경우에 따라서는 한 언어에서만 사용 가능하다. 현실적으로 분석 프로젝트 내에서 한 언어에서 다른 언어로 전환할 수 있어야 각 언어의 장점을 모두 활용할 수 있다. 이 책은 독자가 두 언어의 장점을 모두 활용할 수 있도록 도와줄 것이다.
저자

RamD.Gopal,DanPhilps,Tillma

램고팔(RamD.Gopal)
정보시스템학회(InformationSystemsSociety)의DistinguishedFellow이자앨런튜링(AlanTuringInstitute)의TuringFellow이며,워릭비즈니스스쿨의정보시스템및경영(InformationSystemsandManagement)교수이자연구,참여,영향분야(Research,Engagement,andImpactattheWarwickBusinessSchool)의부학장이다.또한워릭비즈니스스쿨의길모어(GillmoreCentre)금융기술센터의학술이사로도활동하고있다.2008년부터2018년까지코네티컷대학교(UniversityofConnecticut)비즈니스스쿨의운영및정보관리학과(DepartmentofOperationsandInformationManagement)학과장이었고,그는이시기학과장으로서2011년에비즈니스분석및프로젝트관리석사학위프로그램과2014년에비즈니스데이터분석학부전공프로그램을개설하였다.램고팔은빅데이터분석,건강정보학,금융기술,정보보안,개인정보보호및가치평가,지적재산권,온라인시장설계,기술의비즈니스영향등에걸쳐다양하고풍부한연구경험을가지고있다.그는현재워릭비즈니스스쿨에서는풀타임MBA및경영진MBA을위한‘디지털변혁’과정을가르치고있으며,정보시스템및디지털혁신관리석사에서는‘디지털금융,블록체인및암호화화폐’과정을,비즈니스분석석사에서는‘텍스트마이닝’수업을진행하고있다.

목차

1장프로그래밍과통계학소개
R과Python을위한코드저장소(Repository)와빠른시작방법
요약
연습문제

2장데이터요약과시각화
인덱싱과부분추출
조건지정하기
데이터요약하기
팩터변수(FactorVariables)
R에서수치형변수(NumericalVariables)
Python에서수치형변수(NumericalVariables)
ggplot2로그래프그리기
변수하나로그래프그리기
수치형변수(NumericalVariables)
다중변수로그래프그리기
다중수치형변수
다중팩터변수
상호작용그래프
사용사례:산업체가치평가시각화
요약
연습문제

3장데이터관리와준비
데이터관리
열선택하기
보조함수(HelperFunctions)
데이터필터
코드간소화
열이름변경
열복사
열정렬
그룹화(GroupBy)
팩터변수기록
사용사례:Pandas에서판매데이터필터와정렬,분할(Bin)
요약
연습문제

4장프로그래밍기초
기능들
반복(Looping)
벡터화를통한반복문(Loops)대체
While문(WhileLoops)
요약
연습문제

5장확률,확률변수및분포
확률변수
표본크기
경험적분포함수
실용적인예제
분포의평균과분산
일반적으로사용되는분포
R과Python에서분포활용
사용사례:판매데이터에서확률과분포
요약
연습문제

6장분포
다중분포
일변량및다변량분포
변형과합성곱(TransformationsandConvolutions)
표본분포(SAMPLINGDISTRIBUTIONS)
요약
연습문제

7장통계검정-개념과전략
기초개념
통계검정전략
순열검정법
P-value
판단의시간
꼬리이야기
P-value산출함수만들기
심판이되어보기
신뢰구간
요약
연습문제

8장통계검정
연속데이터통계검정
범주형데이터통계검정
연속데이터두개에대한통계검정
범주형데이터두개에대한통계검정
요약
연습문제

9장비모수적검증
중앙값검정
두표본검정(TWO-SAMPLETEST)
상관관계검정
부트스트래핑
합성데이터와GANs
요약
연습문제

10장현실직시(PDF로제공)
요양원과Covid-19
요약
연습문제

11장추정의기본원칙
우도(Likelihood)원칙
수학적최적화
또다른분산
연산최적화
수치결과
이진결과
몇가지주의할점
요약
연습문제

12장선형모델추정
선형회귀분석모델
R과Python에서회귀분석함수
사용예제:선형회귀분석을이용한이익예측
요약
연습문제

13장일반선형모델
이진결과
가산결과
모델적합도
R과Python에서함수
R
요약
연습문제

14장회귀분석과구조
진단
이분산성(Heteroscedasticity)
다중공선성(Multicollinearity)
회귀분석구조
변수선정
사용사례:이익예측,안전우선선형회귀를위한단계
요약
연습문제

15장시계열(imeseries)및예측
시계열구성:트렌드,계절성및노이즈(Noise)
데이터준비:이동평균을이용한계절성제거
간단예측:외삽(Extrapolation)
예측가의가장친한친구:시간의존성(자기상관)
자기회귀분석(Autoregression,AR)을이용한예측
변화예측:트렌드가당신의친구가아닐때
예측킬러:유동성(Nonstationarities)
변화예측:AR과MA결합(ARIMA)
요약
연습문제

16장머신러닝소개
예제1:분류모델에의사결정트리(DecisionTree)적용
예측및정확도(Accuracy)
일반화(Generalization),과적합(Overfitting),정규화(Regularization)
예제2:모델을정규화하여일반화개선
요약
연습문제

17장모델선택과교차검증
모델선택
다른분류기-최근접이웃(NearestNeighbour)
하이퍼-파라미터튜닝(Hyper-ParameterTuning)
모델성능추정
사용사례:어플리케이션등급을모델링하는의사결정트리
요약
연습문제

18장머신러닝에서선형회귀분석모델
손실최소화vs모델추정
선형회귀분석
최소제곱최적화(LeastSquaresOptimization)
회귀분석예제
과소적합(Underfitting)을해결하기위한피쳐확장
비선형모델최적화
더어려운학습문제
요약
연습문제

19장분류모델및평가
분류및확률
서로다른분류기비교
합성데이터예제1
합성데이터예제2
머신러닝이론에대한개요
사용사례:신용위험-불량신용식별
클래스불균형다루기
요약
연습문제

20장머신러닝자동화(PDF로제공)
모델링파이프라인자동화
요약
연습문제

찾아보기

출판사 서평

온라인자료
본책은학생과강사모두의학습과지도를도와주는풍부한온라인자료를지원한다.다음링크를활용하자:study.sagepub.com/gopal

강사를위한지원
●코드노트북:강사용버전(강의를보조하는추가자료포함)코드와배경정보를제공하여강의에도움이될것이다.이는학생의필요에맞게수정할수있는편집가능한노트북형태로제공된다.
●연습문제솔루션:연습문제솔루션코드로수정가능하다.
●사용사례노트북:사용사례에서사용한전체코드로수정가능하다.
●데이터셋:책에서사용한모든데이터셋을제공한다.

학생을위한지원
●코드노트북:학생버전은책에서사용한코드를포함하여실행할수있는전체코드를제공한다.이버전에는배경정보가포함되어있으며,실험을시작하기에적합하다.
●데이터셋:책에서사용한모든데이터셋을제공한다.