MLFlow를 활용한 MLOps (AWS, Azure, GCP에서 MLOps 시작하기)

MLFlow를 활용한 MLOps (AWS, Azure, GCP에서 MLOps 시작하기)

$30.00
Description
머신러닝 솔루션 구축을 위한 프로세스는 1.문제의 식별, 2.데이터 수집, 3.데이터 분석, 4.피처 엔지니어링 및 데이터 정규화, 5.모델 구축, 6.학습, 평가 및 검증, 7.예측 등의 과정이다. MLOps는 데브옵스(DevOps)에서 채택돼 머신러닝에 적용되는 원칙 및 관행으로, 파이프라인의 지속적인 통합과 전달을 보장해 전체 자동화 설정을 완료한다. MLFlow는 기존 코드 베이스에 MLOps 원칙을 통합해 널리 사용되는 다양한 프레임워크를 지원하는 API이다. MLFlow를 사용해서 지표, 파라미터, 그래프 및 모델 자체를 로깅한다. 또한 기록된 모델을 적재하고, 기능을 활용할 수 있다.
프레임워크는 scikit-learn, TensorFlow 2.0/ Keras, PyTorch 및 PySpark의 실험에 MLFlow를 적용하는 방법과 이러한 모델 중 하나를 로컬에 배포하고 모델을 사용해 예측하는 방법을 실행해 본다. 해당 모델을 AWS, Azure, GCP에 배포하고 구성해서 서빙되는 구체적인 방법을 다룬다.
저자

스리다르알라

SridharAlla
SAS코드를Python으로자동변환하는것에초점을맞춘제품Sas2Py(www.sas2py.com)의벤더인Bluewhale.one의설립자이자CTO이다.블루웨일(Bluewhale)은지능적인이메일대화추적부터소매업계에영향을미치는문제등에이르기까지AI를활용해핵심문제를해결하는데도주력하고있다.또한퍼블릭클라우드와사내인프라모두에서AI기반빅데이터분석실무구축에관한깊은전문지식을보유하고있다.그는저자이자수많은Strata,HadoopWorld,SparkSummit및기타콘퍼런스에서열정적인발표자로활동하고있을뿐만아니라대규모컴퓨팅및분산시스템에대해미국PTO에출원한여러특허를보유하고있다.

목차

Chapter1.시작하기:데이터분석
__소개및전제
__신용카드데이터세트
__데이터세트적재
__정상데이터및부정데이터
__플로팅
__요약
Chapter2.모델구축
__소개
__scikit-learn
__데이터프로세싱
__모델학습
__모델평가
__모델검증
__PySpark
__데이터처리
__모델학습
__모델평가
__요약
Chapter3.MLOps는무엇인가?
__소개
__MLOps구축
__수동구현
__지속적인모델전달
__파이프라인의지속적인통합/지속적인전달
__구축에대한회고
__파이프라인및자동화
__파이프라인진행여정
__모델선택
__데이터전처리
__학습프로세스
__모델평가
__모델검증
__모델요약
__MLOps구현방법
__요약
Chapter4.MLFlow소개
__소개
__사이킷런(Scikit-Learn)을활용한MLFlow
__데이터처리
__MLFlow를통한학습및평가
__MLFlow실행로깅및확인
__로깅된모델적재
__MLFlow를사용한모델검증(파라미터튜닝)
__파라미터튜닝-GuidedSearch
__MLFlow및기타프레임워크TensorFlow2.0을사용한MLFlow(Keras)
__데이터처리
__MLFlow실행-학습및평가
__MLFlow모델적재
__PyTorch를사용한MLFlow
__데이터처리
__MLFlow실행-학습및평가
__MLFlowUI-실행체크
__MLFlow모델적재
__PySpark을사용하는MLFlow
__데이터처리
__MLFlow실행-학습,UI및MLFlow모델적재
__로컬모델서빙모델배포
__모델쿼리
__스케일링없는쿼리
__스케일링을사용한쿼리
__배치쿼리
__요약
Chapter5.AWS에배포
__소개
__AWS구성
__AWSSageMaker에모델배포
__예측하기
__모델전환
__배포된모델제거
__요약
Chapter6.Azure에배포
__소개
__Azure구성
__Azure에배포(개발단계)
__예측하기
__운영환경에배포
__예측하기
__자원정리하기
__요약
Chapter7.Google에배포
__소개
__Google구성
__버킷스토리지
__가상머신구성
__방화벽구성
__모델배포및쿼리
__배포업데이트및제거
__자원정리하기
__요약
Appendix.Databricks
__소개
__Databricks에서실험실행
__Azure에배포
__워크스페이스에연결
__모델쿼리
__MLFlow모델레지스트리
__요약

출판사 서평

◈이책에서다루는내용◈
◆기본데이터분석수행및scikit-learn및PySpark모델구축
◆모델학습,테스트및검증(하이퍼파라미터튜닝)
◆MLOps의정의와이상적인MLOps구축
◆기존또는향후프로젝트에MLFlow를쉽게통합
◆클라우드에모델을배포하고예측수행


◈이책의대상독자◈
이책은머신러닝초보자부터고급머신러닝엔지니어,실험의더나은구성법을배우고자하는머신러닝연구원까지머신러닝에관심있는모든독자를대상으로한다.


◈이책의구성◈
1,2장은신용카드데이터셋에기반한이상검출기모델에MLOps원리를통합하는방법을다룬다.
3장에서는MLOps가무엇인지,작동방식및어떻게유용할수있는지에관한이유에대해소개한다.
4장에서는기존프로젝트에서MLFlow를구현하고활용해몇줄의코드만으로MLOps의이점을누릴수있는방법에대해자세히설명한다.
5장,6장,7장에서는모델을운영해AWS,MicrosoftAzure및GoogleCloud에각각구축할수있는방법을다룬다.
7장에서는가상머신에서모델을호스팅하고외부소스에서서버에연결해예측을수행하는방법을설명한다.따라서설명서에설명된MLFlow기능이오래되면언제든지이방식을사용해클라우드상의일부클러스터에서모델을서비스할수있다.
마지막장인부록에서는MLFlow를만든Databricks를활용해MLFlow실험을구성하고모델을배치하는방법에대해설명한다.