인과 데이터 사이언스 (AI 시대를 위한 분석·평가 모델링의 진화)

인과 데이터 사이언스 (AI 시대를 위한 분석·평가 모델링의 진화)

$33.71
Description
머리말

우리가 데이터를 다루고 세상을 이해하는 방식은 근본적으로 변화하였다. 머신러닝과 딥러닝 등 인공지능의 급속한 발전은 단순히 예측(Prediction) 정확도를 높이는 데 그치지 않고, 이제 인과추론(Causal Inference)의 영역에까지 깊숙이 들어와 있다.
우리는 지금 '인과 데이터 사이언스(Causal Data Science)'의 시대로 진입하고 있다. 이는 과거와 같이 "무슨 일이 일어났는가?"를 설명하거나 "무슨 일이 일어날 것인가?"를 예측하는 것에 머물지 않는다. 인과 데이터 사이언스는 "우리가 무엇을 해야 원하는 결과를 얻을 수 있는가?"라는 질문, 즉 최적의 개입(Intervention)과 의사결정을 탐구하는 학문이다. 이러한 변화는 공공정책 분야뿐만 아니라, 기업의 마케팅 전략 최적화, 의료 분야의 맞춤형 치료 효과 분석, 플랫폼 비즈니스의 A/B 테스트 고도화 등 모든 의사결정 영역에서 동시에 일어나고 있다.
특히 주목할 만한 변화는 '증거 기반 정책(Evidence-based Policy)'이 'AI 기반 적응형 정책(AI-driven Adaptive Policy)'으로 진화하고 있다는 점이다. 전통적인 증거 기반 접근은 검증하는 데 초점을 맞추어 환경 변화에 대한 대응이 느리고 실시간 학습이 어렵다는 한계가 있었다. 반면 AI 기반 적응형 접근은 실시간 데이터 수집, 즉각적인 효과 추정, 그리고 알고리즘적 의사결정을 통해 개입 자체가 환경으로부터 학습하고 진화하는 시스템을 구현한다.
이러한 전환은 분석가의 역할 또한 근본적으로 변화시킨다. 과거의 분석가가 데이터를 정리하고 통계 모형을 적합하여 보고서를 작성하는 '기술자'였다면, 이제의 분석가는 인과적 질문을 설계하고, 알고리즘의 편향을 감지하며, 최적의 개입을 추천하는 '의사결정 과학자(Decision Scientist)'가 되어야 한다.
AI는 강력한 도구이지만, 그 자체로 만능은 아니다. 우리는 의사결정 과학자로서 기술에 대해 열린 자세를 가지되, 언제나 비판적 시각을 견지해야 한다. 기술이 인간의 판단을 대체하는 것이 아니라, 인간이 더 현명하고 공정한 결정을 내릴 수 있도록 돕는 도구가 되어야 하기 때문이다.
저자는 인문사회과학과 AI·Software 기술의 경계를 넘나드는 융합적 학문을 지향한다. 이 책이 그러한 여정의 이정표이자, 새로운 항해를 시작하는 동료 연구자들을 위한 안내서가 되길 희망한다.
저자

이석민

현재한신대학교공공인재빅데이터융합학부에서AI기반정책분석과딥러닝응용연구를진행하고있다.[AI를활용한시니어정신건강진단앱]을개발하고특허출원하였다.
저서로는[R과STATA를활용한정책평가방법론](2017),[빅데이터분석방법론],[구조방정식:준실험설계접근]등이있으며,행정학학술지,TransactionsonSoftwareandDataEngineering,JournalofInformationProcessingSystems(JIPS)등에논문을게재하였다.웹프로그래밍,데이터베이스,MLOps,딥러닝자연어처리및영상처리,AI에이전트,정책분석평가,분석기획론등인문사회과학과AIㆍSoftware기술을융합하는교육을실천하고있다.

목차

제1장의사결정과학과AI기반인과데이터사이언스
1.1AI시대의인과데이터사이언스
1.2AI기반분석ㆍ평가프레임워크와기술통합
1.3전통적방법론과CausalML의비교
제2장인과추론기초와인과머신러닝
2.1잠재적결과프레임워크(PotentialOutcomesFramework)
2.2전통적인과추론방법론개요
2.3CausalMachineLearning의등장
2.4CausalML핵심방법론
2.5실습:EconML패키지활용
2.6CausalML과PredictiveAnalytics의통합
제3장성향점수매칭(PSM)에서딥러닝기반성향점수매칭으로
3.1전통적성향점수매칭(PSM)
3.2성향점수추정을위한기계학습(MachineLearning)
3.3심층비모수성향점수(DeepNonparametricPropensityScores)
3.4최적화된공변량균형(OptimizedCovariateBalance)
3.5PyTorch기반딥성향점수매칭(DeepPSM)구현
제4장이중차분법(DID)과합성통제법(SCM)의기계학습확장
4.1전통적이중차분법(Difference-in-Differences)
4.2이중기계학습(DoubleMachineLearning)과DID확장
4.3합성통제법(SyntheticControlMethod)
4.4합성이중차분법(SyntheticDifference-in-Differences,SDID)
4.5검증방법론
4.6종합구현
4.7방법론선택전략과연구전망
제5장회귀불연속설계(RDD)와기계학습방법론
5.1회귀불연속설계의기본원리
5.2비모수적추정과대역폭선택
5.3퍼지회귀불연속(FuzzyRDD)과도구변수접근
5.4기계학습과RDD의통합:이중기계학습(DML)
5.5이질적처치효과추정:조건부평균처치효과(CATE)와BART
5.6지리적경계회귀불연속설계(GeographicRDD)
5.7한국정책평가에서의RDD적용과과제
제6장도구변수법(IV)과DeepIV
6.1전통적도구변수(InstrumentalVariables)
6.2전통적도구변수의한계
6.3DeepIV(Hartfordetal.,2017)
6.4DeepGMM(Bennettetal.,2019)
6.5DeepFeatureIV(DFIV,Xuetal.,2021)
6.6KernelIV(KIV,Singhetal.,2019)
6.7딥러닝도구변수방법론종합비교
6.8이질적처치효과추정
6.9교육수익률추정
제7장분위회귀(QuantileRegression)와분포적처치효과
7.1분위회귀의기초
7.2분위처치효과(QuantileTreatmentEffects)
7.3분포적이중차분법(DistributionalDID)과Changes-in-Changes
7.4분위회귀를위한기계학습방법론
7.5종합실습:교육정책의분포적효과분석
7.6최신연구동향과미래방향
제8장A/B테스트와적응형실험설계
8.1전통적A/B테스트(RCT)의한계
8.2적응형시험설계(AdaptiveTrialDesign)의등장
8.3반응적응형무작위배정(RAR)과Multi-ArmedBandits
8.4BayesianAdaptiveDesign
8.5디지털헬스케어서비스최적화사례
8.6최신연구동향과미래방향
8.7기계학습앙상블RAR과하이브리드접근
제9장딥러닝기반시계열예측과전략적활용
9.1딥러닝기초와신경망
9.2시계열분석과인과추론
9.3순환신경망(RNN)의구조와한계
9.4장단기메모리네트워크(LSTM)와GRU
9.5시계열예측모델링실습
9.6최신연구동향과향후방향
제10장딥러닝기반텍스트분석과문서지능
10.1딥러닝기반텍스트분석개론
10.2Transformer아키텍처의이해와텍스트분석응용
10.3한국어특화사전학습모델:KoBERT,HyperCLOVA,XAONE
10.4문서분류,감정분석,유사도탐지
10.5BERTopic기반고급토픽모델링
10.6문서분석파이프라인구축실습
10.7미래전망과실무적용가이드
제11장그래프신경망(GNN)과조직네트워크분석
11.1그래프이론기초와네트워크과학
11.2네트워크중심성분석과영향력측정
11.3커뮤니티탐지와전략적제휴분석
11.4동적네트워크분석과혁신확산모델링
11.5한계와비판적평가
제12장복잡계이론과비즈니스시뮬레이션
12.1복잡계이론과시스템의창발성
12.2시스템다이내믹스와전략피드백
12.3에이전트기반모델링(ABM)
12.4강화학습과의사결정최적화
12.5복잡계모델링의검증과한계