파이썬과 JAX로 추천 시스템 구축하기 (만들면서 배우는 대규모 상용 추천 시스템 | 반양장)

파이썬과 JAX로 추천 시스템 구축하기 (만들면서 배우는 대규모 상용 추천 시스템 | 반양장)

$34.94
Description
당신이 이 책을 발견한 것도 추천 시스템 덕분이다
최신 추천 시스템을 설계하는 방법은 그 활용 분야만큼이나 다양하다. 이 책은 실무자가 알아야 할 핵심 개념과 예제를 설명하며, 추천 시스템을 처음 구축하는 사람부터 경험이 많은 개발자까지 모두 활용할 수 있도록 구성됐다. 추천 시스템을 설계하는 데 필요한 수학적 개념, 아이디어, 구현 방법을 체계적으로 알려주며, 파이썬, JAX, PySpark, SparkSQL, FastAPI를 사용하여 실제로 추천 시스템을 구축하는 직관적인 코드 예제를 제공한다. 이 책을 통해 추상적인 추천 시스템 개념을 구체적으로 학습해보자.
저자

브라이언비쇼프,헥터이

저자:브라이언비쇼프(BryanBischof)
Hex의AI리드.순수수학박사학위를취득했고,럿거스대학교의겸임교수로데이터과학을가르치고있다.이전에는웨이트앤바이어스에서데이터과학책임자로근무하며DS,ML,데이터엔지니어링팀을구축했다.스티치픽스에서의류추천시스템,웨이트앤바이어스에서기술블로그게시물추천시스템,블루보틀커피에서세계최초의커피추천시스템을구축했고,지금은AI에이전트를위한추천시스템을구축하고있다.

저자:헥터이(HectorYee)
컴퓨터그래픽전문가소프트웨어공학자
컴퓨터그래픽석사학위를취득했고,영화(슈렉2),게임(커맨드앤컨커),추천시스템(유튜브)분야에서근무한소프트웨어엔지니어.지금은구글에서근무하며이미지검색의첫번째콘텐츠기반랭킹시스템,자율주행자동차인식,유튜브추천시스템구축등여러프로젝트에참여했다.개인화된동영상랭킹기술연구로기술및엔지니어링에미상을수상했다.

역자:동동구
현재전략기획업무를수행하고있다.이전에는B2C및B2B웹애플리케이션,Brew/WIPI/SKVM등의피처폰애플리케이션,iOS/안드로이드/윈도우폰/타이젠애플리케이션등의설계및개발,엔지니어관리업무를수행했다.최근에는국내개발자들을위해IT서적을번역하고있으며,옮긴책으로는《파이썬시계열예측분석》(제이펍),《MLOps도입가이드》(한빛미디어),《파이썬비동기라이브러리Asyncio》(한빛미디어)가있다.

목차

옮긴이머리말xii
추천의글xiv
베타리더후기xv
추천사xviii
시작하며xx
감사의글xxiii
표지에대하여xxv

PARTI워밍업
CHAPTER1소개3
1.1추천시스템의주요구성요소4
__1.1.1수집기4
__1.1.2랭커4
__1.1.3서버4
1.2가장간단한추천시스템5
__1.2.1간단한추천시스템5
__1.2.2가장인기있는아이템추천시스템6
1.3JAX에대한친절한소개8
__1.3.1기본형,초기화,불변성8
__1.3.2인덱싱과슬라이싱10
__1.3.3브로드캐스팅11
__1.3.4난수11
__1.3.5JIT컴파일12
1.4요약13

CHAPTER2사용자-아이템평점및문제정의하기15
2.1사용자-아이템행렬15
2.2사용자-사용자대아이템-아이템협업필터링19
2.3넷플릭스챌린지20
2.4암묵적평점21
2.5데이터수집및사용자로깅22
__2.5.1기록대상22
__2.5.2수집및계측26
__2.5.3퍼널27
2.6비즈니스인사이트와사람들이좋아하는것29
2.7요약30

CHAPTER3수학적고려사항33
3.1RecSys에서지프의법칙과마태효과33
3.2희소성37
3.3협업필터링을위한사용자유사도38
__3.3.1피어슨상관관계40
__3.3.2유사도를통한평가40
3.4추천시스템으로서의탐색-활용41
__3.4.1-그리디전략42
__3.4.2은무엇이어야하나요?44
3.5NLP와RecSys의관계45
__3.5.1벡터검색45
__3.5.2최근접이웃검색47
3.6요약47

CHAPTER4추천시스템설계49
4.1온라인대오프라인50
4.2수집기51
__4.2.1오프라인수집기51
__4.2.2온라인수집기51
4.3랭커52
__4.3.1오프라인랭커52
__4.3.2온라인랭커53
4.4서버53
__4.4.1오프라인서버53
__4.4.2온라인서버54
4.5요약54

CHAPTER5모두하나로합치기:콘텐츠기반추천시스템55
5.1버전관리소프트웨어56
5.2파이썬빌드시스템57
5.3무작위아이템추천시스템59
5.4STL데이터셋에서이미지가져오기61
5.5합성곱신경망의정의62
5.6JAX,Flax,Optax를사용하여모델훈련하기63
5.7입력파이프라인65
5.8요약79

PARTII검색
CHAPTER6데이터처리83
6.1시스템에수분공급하기83
__6.1.1파이스파크83
__6.1.2예시:파이스파크에서의사용자유사도88
__6.1.3DataLoader93
__6.1.4데이터베이스스냅숏95
6.2학습및추론을위한데이터구조97
__6.2.1벡터검색97
__6.2.2최근접이웃근사하기99
__6.2.3블룸필터100
__6.2.4흥미로운점:추천시스템으로서의블룸필터101
__6.2.5피처스토어102
6.3요약106

CHAPTER7모델및아키텍처제공107
7.1추천구조에따른아키텍처107
__7.1.1아이템별사용자추천108
__7.1.2쿼리기반추천108
__7.1.3콘텍스트기반추천110
__7.1.4시퀀스기반추천111
__7.1.5왜추가적인특징이필요할까요?111
7.2인코더아키텍처와콜드스타트문제112
7.3배포115
__7.3.1API로서의모델115
__7.3.2모델서비스시작하기116
__7.3.3워크플로오케스트레이션118
7.4알림및모니터링120
__7.4.1스키마및선행조건121
__7.4.2통합테스트122
__7.4.3관측가능성123
7.5상용환경에서의평가124
__7.5.1느린피드백125
__7.5.2모델지표125
7.6지속적인훈련및배포126
__7.6.1모델드리프트126
__7.6.2배포토폴로지127
7.7평가플라이휠130
__7.7.1일일웜스타트131
__7.7.2람다아키텍처및오케스트레이션132
__7.7.3로깅133
__7.7.4능동학습136
7.8요약140

CHAPTER8모두하나로합치기:데이터처리및집계추천기141
8.1기술스택142
8.2데이터표현143
8.3빅데이터프레임워크145
__8.3.1클러스터프레임워크146
__8.3.2파이스파크예제147
8.4GloVe모델정의157
__8.4.1JAX와Flax내의GloVe모델의사양158
__8.4.2Optax로GloVe모델훈련하기160
8.5요약162

PARTIII순위
CHAPTER9특징기반및카운팅기반추천165
9.1이중선형요인모델(지표학습)166
9.2특징기반웜스타트169
9.3세분화모델과하이브리드171
__9.3.1태그기반추천기172
__9.3.2하이브리드화174
9.4이중선형모델의한계175
9.5카운팅기반추천기176
__9.5.1MPIR로돌아가기176
__9.5.2상관관계마이닝178
__9.5.3동시출현을통한포인트별상호정보180
__9.5.4동시출현에서의유사도181
__9.5.5유사도기반추천182
9.6요약183

CHAPTER10낮은계수방법185
10.1잠재공간185
10.2도트곱유사도187
10.3동시출현모델189
10.4추천기문제의계수줄이기191
__10.4.1ALS를이용한MF최적화193
__10.4.2MF를위한정규화194
__10.4.3정규화된MF구현195
__10.4.4WSABIE219
10.5차원축소219
__10.5.1아이소메트릭임베딩223
__10.5.2비선형국소측정가능임베딩225
__10.5.3중심커널정렬226
10.6선호도및판매확률227
10.7추천시스템평가를위한성향가중치적용228
__10.7.1성향229
__10.7.2심슨의역설과교란완화231
10.8요약233

CHAPTER11개인화된추천지표235
11.1환경236
__11.1.1온라인및오프라인236
__11.1.2사용자대아이템지표237
__11.1.3A/B테스트238
11.2재현율과정밀도239
__11.2.1@k241
__11.2.2k에서의정밀도241
__11.2.3k에서재현율241
__11.2.4R-정밀도242
11.3mAP,MRR,NDCG242
__11.3.1mAP243
__11.3.2MRR243
__11.3.3NDCG244
__11.3.4mAP대NDCG?245
__11.3.5상관계수246
11.4친화도에서의RMSE247
11.5적분형태:AUC및cAUC247
__11.5.1추천확률에서AUC-ROC로247
__11.5.2다른지표와의비교248
11.6BPR249
11.7요약249

CHAPTER12순위를매기기위한훈련251
12.1추천시스템에서순위결정의역할251
12.2순위결정학습252
12.3LTR모델훈련하기253
__12.3.1분류를통한순위결정253
__12.3.2회귀를통한순위결정254
__12.3.3분류및회귀를통한순위결정255
12.4WARP255
12.5k-차통계257
12.6BM25258
12.7멀티모달검색261
12.8요약261

CHAPTER13모두하나로합치기:실험과순위결정263
13.1실험팁263
__13.1.1단순하게유지하세요264
__13.1.2디버그출력문264
__13.1.3최적화지연265
__13.1.4변경사항추적266
__13.1.5피처엔지니어링사용266
__13.1.6이해지표대비즈니스지표267
__13.1.7빠른반복수행267
13.2스포티파이의수백만재생목록데이터셋268
__13.2.1URI딕셔너리구축하기270
__13.2.2훈련데이터구성하기272
__13.2.3입력읽기275
__13.2.4문제모델링하기277
__13.2.5손실함수구성하기281
13.3연습285
13.4요약286

PARTIV서비스제공
CHAPTER14비즈니스로직289
14.1하드순위결정290
14.2학습된회피291
14.3수동조정가중치292
14.4재고건전성293
14.5회피구현하기294
14.6모델기반회피296
14.7요약297

CHAPTER15추천시스템의편향성299
15.1추천의다양화300
__15.1.1다양성개선하기300
__15.1.2포트폴리오최적화적용하기302
15.2다중목적함수303
15.3프레디케이트푸시다운304
15.4공정성306
15.5요약307

CHAPTER16가속구조309
16.1샤딩310
16.2지역민감해싱310
16.3k-d트리313
16.4계층적k-평균316
16.5더저렴한검색방법318
16.6요약319

PARTV추천시스템의미래
CHAPTER17순차적추천기323
17.1마르코프체인324
__17.1.12차마르코프체인325
__17.1.2기타마르코프모델326
17.2RNN및CNN아키텍처327
17.3어텐션아키텍처329
__17.3.1셀프어텐션에의한순차적추천331
__17.3.2BERT4Rec331
__17.3.3최신성샘플링332
__17.3.4정적및순차적병합332
17.4요약334

CHAPTER18추천시스템의미래335
18.1멀티모달추천336
18.2그래프기반추천기338
__18.2.1신경망메시지전달339
__18.2.2애플리케이션340
__18.2.3랜덤워크342
__18.2.4메타패스와이질성343
18.3LLM애플리케이션344
__18.3.1LLM추천기344
__18.3.2LLM

출판사 서평

추천시스템의비밀을파헤치는책
현대비즈니스환경에서는고객의취향에맞춘개인화추천시스템(RecSys)이필수다.그러나추천시스템은다양한알고리즘,데이터처리기법,모델평가방식등여러요소가복합적으로작용하여접근하기어렵고,기존의ML커리큘럼에서는다루지않는경우가많아실무자들이막막함을느끼기쉽다.
이책은추천시스템을구축하는데필요한모든핵심요소(데이터수집,문제정의,모델선택,평가,배포)를명확하고체계적으로설명한다.파이썬과JAX를포함한실습예제와함께,추천시스템분야에서빠르게변화하는기술동향과MLOps도구를활용하는방법을제공함으로써접근하기어려웠던상황을해소할수있도록돕는다.
이책은수십년간의추천시스템발전을한권에집약한실용적지침서다.추상적인추천시스템개념을실제적용가능한코드와사례로풀어낸이책을통해추천시스템을성공적으로구축해보자.

대상독자
추천시스템의핵심개념과알고리즘을배우고직접구현해보고자하는머신러닝엔지니어
대규모데이터처리및MLOps도구를활용하여추천시스템인프라를구축하고자하는개발자또는데이터과학자
고객맞춤형추천기능을통해비즈니스성과를높이고자하는제품관리자
추천시스템의이론적배경과실제구현사례를학습과연구에활용하려는연구원

주요내용
데이터및비즈니스문제를RecSys문제로전환하기
RecSys구축을시작하기위한필수데이터파악하기
RecSys문제에적합한모델을정하고,이를어떻게평가해야하는지결정하기
모델을구현하고,훈련하고,테스트하고,배포하기
지표를추적하여시스템이계획대로작동하는지확인하기
사용자,제품,비즈니스사례를파악하면서시스템을점진적으로개선하기