머신러닝 엔지니어링 with 파이썬 (AWS 클라우드에서 구현하는 MLOps 기반 머신러닝 모델 라이프사이클 관리 | 반양장)

머신러닝 엔지니어링 with 파이썬 (AWS 클라우드에서 구현하는 MLOps 기반 머신러닝 모델 라이프사이클 관리 | 반양장)

$32.73
Description
ML옵스를 활용한 실용적 예제로 머신러닝 모델의 프로덕션 수명주기 관리하기!
《머신러닝 엔지니어링 with 파이썬》은 ML옵스(MLOps) 엔지니어와 머신러닝(ML) 엔지니어가 실제 문제에 대한 해결책을 구축하는 것을 돕는 실용적인 안내서다. 이 책은 빠르게 발전하는 이 분야에서 앞서 나가는 데 필요한 기술을 제공한다.
이 책은 예제 중심으로 접근해 기술을 개발하는 데 도움을 주며, 필요한 기술적 개념, 구현 패턴 및 개발 방법론을 다룬다. ML 개발 수명주기의 주요 단계를 탐색하고 모델 훈련 및 재훈련을 위한 표준화된 ‘모델 팩토리’를 만드는 방법을 배운다. CI/CD 개념을 활용하고 다양한 유형의 드리프트를 감지하는 방법도 배운다.

또한 이 책에서는 최신 배포 아키텍처를 실습하고 솔루션 확장 방법을 배운다. 최신 오픈소스 및 클라우드 기반 기술에 중점을 두고 ML 엔지니어링과 ML옵스의 모든 측면을 깊이 다룬다. 여기에는 고급 파이프라인 및 오케스트레이션 기법에 대한 완전히 새로운 접근 방식이 포함되어 있다.
딥러닝, 생성형 AI, LLM옵스를 다루는 장에서는 랭체인, 파이토치, 허깅 페이스와 같은 도구를 사용해 LLM의 강력한 능력을 활용하는 분석 방법을 배운다. 깃허브 코파일럿 등 AI 어시스턴트를 활용해 생산성을 높이는 법을 배우고, 딥러닝 작업의 엔지니어링 고려 사항을 심층적으로 살펴본다.

★ 이 책에서 다루는 내용 ★

◎ 엔드투엔드 ML 개발 프로젝트의 계획 및 관리
◎ 생성형 AI를 활용하기 위한 딥러닝, LLM, LLM옵스
◎ 파이썬을 이용한 ML 도구의 패키징과 솔루션 확장
◎ 아파치 스파크, 쿠버네티스, 레이 활용
◎ 아파치 에어플로, 젠ML, 쿠브플로를 활용한 ML 파이프라인 구축과 실행
◎ 드리프트 감지 및 재훈련 메커니즘을 솔루션에 통합
◎ 제어 흐름 및 취약점 스캐닝을 통한 오류 처리 개선
◎ AWS를 활용한 ML 마이크로서비스와 배치 프로세스 구축 및 운영
저자

앤드루피터맥마흔

다양한산업분야에서영향력있는ML제품을구축한경험이있다.현재영국냇웨스트그룹(NatWestGroup)의ML옵스(MLOps)책임자이며임페리얼칼리지에서응집물질이론물리학박사학위를받았다.활발한블로거,연설가,팟캐스트게스트이자ML옵스커뮤니티의유명인사로서,AIRight팟캐스트의공동진행자이며,2022년BritishDataAwards에서‘올해의라이징스타’로,2019년DataScienceFoundation에서'올해의데이터과학자'로선정됐다.

목차

▣01장:머신러닝엔지니어링소개
1.1기술요구사항
1.2데이터관련직무분류
__1.2.1데이터과학자
__1.2.2ML엔지니어
__1.2.3ML옵스엔지니어
__1.2.4데이터엔지니어
1.3효과적인팀으로일하기
1.4실제환경에서의머신러닝엔지니어링
1.5머신러닝솔루션은어떤모습인가?
__1.5.1왜파이썬인가?
1.6고수준머신러닝시스템설계
__1.6.1예제1:배치이상탐지서비스
__1.6.2예제2:예측API
__1.6.3예제3:분류파이프라인
1.7요약

▣02장:머신러닝개발프로세스
2.1기술요구사항
2.2도구설정
__2.2.1AWS계정설정
2.3개념에서솔루션까지의4단계
__2.3.1CRISP-DM과비교
__2.3.2발견
__2.3.3플레이
__2.3.4개발
__2.3.5배포
2.4요약

▣03장:모델에서모델팩토리까지
3.1기술적요구사항
3.2모델팩토리정의하기
3.3학습이란무엇인가
__3.3.1목표정의하기
__3.3.2손실최소화하기
__3.3.3데이터준비하기
3.4머신러닝을위한특징공학
__3.4.1범주형특징처리하기
__3.4.2수치형특징처리하기
3.5훈련시스템설계하기
__3.5.1훈련시스템설계옵션
__3.5.2훈련-실행
__3.5.3훈련-보관
3.6드리프트와재훈련
__3.6.1데이터드리프트감지
__3.6.2개념드리프트탐지하기
__3.6.3한계설정하기
__3.6.4드리프트를진단하기
__3.6.5드리프트대응방안
__3.6.6모니터링을위한다른도구
__3.6.7훈련자동화하기
__3.6.8자동화의계층
__3.6.9하이퍼파라미터최적화
3.6.10오토ML
3.7모델영속화하기
3.8파이프라인으로모델팩토리구축하기
__3.8.1사이킷런파이프라인
__3.8.2스파크ML파이프라인
3.9요약

▣04장:패키징
4.1기술적요구사항
4.2좋은파이썬코드작성하기
__4.2.1파이썬기초다지기
__4.2.2유용한기법
__4.2.3파이썬코딩관례
__4.2.4PySpark코딩스타일
4.3코딩스타일선택하기
__4.3.1객체지향프로그래밍
__4.3.2함수형프로그래밍
4.4코드패키징하기
__4.4.1패키지를만드는이유
__4.4.2어떤코드를패키지로만들까?
__4.4.3패키지설계하기
4.5패키지빌드하기
__4.5.1Makefile로환경관리하기
__4.5.2Poetry로시작하기
4.6테스팅,로깅,보안및오류처리
__4.6.1테스팅
__4.6.2솔루션보안
__4.6.3코드의보안문제분석하기
__4.6.4의존성패키지의보안점검
__4.6.5로깅
__4.6.6오류처리
4.7바퀴를재발명하지않기
4.8요약

▣05장:배포패턴과도구
5.1기술적요구사항
5.2시스템설계
__5.2.1시스템설계원칙
5.3대표적인머신러닝패턴
__5.3.1데이터레이크
__5.3.2마이크로서비스
__5.3.3이벤트기반설계
__5.3.4일괄처리
5.4컨테이너화
5.5AWS에서자체마이크로서비스호스팅
__5.5.1ECR로푸시하기
__5.5.2ECS에배포하기
5.6Airflow를활용한일반파이프라인구축
__5.6.1Airflow
__5.6.2MWAA
__5.6.3Airflow를위한CI/CD파이프라인구축
5.7고급ML파이프라인구축
__5.7.1ZenML
__5.7.2Kubeflow
5.8배포전략선택
5.9요약

▣06장:스케일링
6.1기술적요구사항
6.2스파크로확장하기
__6.2.1스파크팁과트릭
__6.2.2클라우드상의스파크,AWSEMR
6.3서버리스인프라구축
6.4쿠버네티스로대규모컨테이너화하기
6.5Ray로확장하기
__6.5.1ML을위한Ray시작하기
__6.5.2Ray의컴퓨팅확장
__6.5.3Ray를활용한서빙계층확장
6.6대규모시스템설계
6.7요약

▣07장:딥러닝,생성형AI,LLM옵스
7.1딥러닝
__7.1.1파이토치기초
__7.1.2딥러닝확장과프로덕션적용
__7.1.3미세조정과전이학습
7.2대규모언어모델
__7.2.1LLM기본개념과구조
__7.2.2API를통한LLM활용
__7.2.3LLM으로코딩하기
7.3LLM검증과프롬프트관리·운영
__7.3.1LLM검증하기
__7.3.2프롬프트옵스(PromptOps)
7.4요약

▣08장:예제ML마이크로서비스구축
8.1기술요구사항
8.2예측문제이해
8.3예측서비스설계
8.4도구선택
8.5훈련스케일링
8.6FastAPI로모델서빙하기
__8.6.1응답및요청스키마
__8.6.2마이크로서비스에서모델관리하기
__8.6.3모든구성요소통합하기
8.7쿠버네티스를활용한컨테이너화와배포
__8.7.1애플리케이션컨테이너화
__8.7.2쿠버네티스로확장하기
__8.7.3배포전략
8.8요약

▣09장:ETML(추출,변환,머신러닝)사례연구
9.1기술요구사항
9.2일괄처리문제이해
9.3ETML솔루션설계
9.4도구선택하기
__9.4.1인터페이스와저장소
__9.4.2모델확장
__9.4.3ETML파이프라인스케줄링
9.5빌드실행
__9.5.1고급Airflow기능을사용한ETML파이프라인구축
9.6요약