LLM 엔지니어링 (RAG, 파인튜닝, LLMOps로 완성하는 실무 중심의 LLM 애플리케이션 개발)

LLM 엔지니어링 (RAG, 파인튜닝, LLMOps로 완성하는 실무 중심의 LLM 애플리케이션 개발)

$38.00
Description
LLM 엔지니어링의 모든 것을 망라한 실전 가이드
이 책은 프로덕션 수준의 LLM 애플리케이션을 개발하고 배포하는 데 필요한 엔지니어링 방법들을 상세히 안내한다. LLM 라이프사이클을 체계적으로 살펴보며, 데이터 엔지니어링부터 지도 학습 파인튜닝, 모델 평가, 추론 최적화, RAG 파이프라인 개발까지 핵심 개념과 실용적인 기술들을 다룬다. 이 과정에서 ‘LLM Twin’이라는 실제 프로젝트를 통해 개인의 글쓰기 스타일과 성격을 모방하는 AI를 구현하며, 데이터 수집과 전처리, 모델 파인튜닝 등 LLM 엔지니어링의 실전 노하우를 깊이 있게 익힐 수 있다. 이 책이 제시하는 실질적인 로드맵을 따라 데이터 수집부터 모델 최적화까지의 전 과정을 단계별로 학습해보며, LLM 엔지니어링 역량을 한 단계 더 높이길 바란다.

누구를 위한 책 인가요?
● LLM 개발자: 챗GPT 활용을 넘어, 직접 AI 시스템을 만들고 싶은 개발자
● AI 엔지니어: RAG, LoRA·QLoRA 등 최신 기법을 실습하고 싶은 전문가
● ML 시스템 엔지니어: LLMOps 기반으로 AI를 서비스에 안정적으로 배포·운영하고 싶은 분
● 기술 리더: 데이터 설계부터 배포까지 LLM 구축 전 과정을 체계적으로 배우고 싶은 팀장

무엇을 주로 다루나요?
● LLM 애플리케이션 아키텍처 설계: 개인화된 AI 캐릭터 ‘LLM Twin’ 기획 및 시스템 구성
● 데이터 수집 및 전처리: 웹스크래핑 + 몽고DB·Qdrant 기반 데이터 저장·검색
● RAG 파이프라인 개발: 고급 아키텍처 설계 및 문서 기반 지시문-답변 구현
● 지도 학습 파인튜닝(SFT): 지시문 데이터셋 생성 + LoRA·QLoRA 활용
● 직접 선호 최적화(DPO): 사용자 선호를 반영한 정렬 파인튜닝
● 모델 평가 및 튜닝: LLM·RAG 성능 측정 및 TwinLlama 실험
● 추론 최적화: 양자화, 병렬 처리 등 실시간 추론 성능 향상
● LLM 애플리케이션 배포: FastAPI 서버 구현 + 오토스케일링 기반 배포
● LLMOps 실전 적용: 버전 관리·모니터링 등 운영 자동화 전략
저자

폴이우수틴,막심라본

저자:폴이우수틴PaulIusztin
7년이상생성형AI,컴퓨터비전및MLOps설루션을구축한시니어ML/MLOps엔지니어.최근에는Metaphysic에서대규모신경망을프로덕션에적용하는핵심엔지니어로근무했다.또한프로덕션급ML교육채널인DecodingML을설립해사람들이ML시스템을구축할수있도록IT기사와오픈소스강좌를제공하고있다.

저자:막심라본MaximeLabonne
LiquidAI의모델최적화총괄책임자.파리폴리테크닉연구소에서ML박사학위를취득했으며,AI/ML분야의구글개발자로일하고있다.LLM과정과LLMAutoEval등의도구,NeuralDaredevil과같은SOTA모델을포함해오픈소스커뮤니티에활발히기여하고있으며,기술블로그도꾸준히운영하고있다.저서로는『핸즈온그래프인공신경망withPython』(홍릉,2024)이있다.

역자:조우철
포스코이앤씨AI연구원.사내에서LLM응용기술개발업무를담당하며,LLM기반입찰/계약문서검토설루션개발등다양한AI설루션개발프로젝트를수행했다.링크드인과페이스북에LLM기술관련글을올리고있다.

목차


CHAPTER1LLMTwin개념과아키텍처이해
_1.1LLMTwin개념
_1.2LLMTwin의제품기획
_1.3특성,학습,추론파이프라인기반ML시스템개발
_1.4LLMTwin의시스템아키텍처설계
_요약
_참고문헌

CHAPTER2도구및설치
_2.1파이썬생태계와프로젝트설치
_2.2MLOps와LLMOps도구
_2.3비정형데이터와벡터데이터를저장하기위한데이터베이스
_2.4AWS사용준비
_요약
_참고문헌

CHAPTER3데이터엔지니어링
_3.1LLMTwin의데이터수집파이프라인설계
_3.2LLMTwin의데이터수집파이프라인구현
_3.3원시데이터를데이터웨어하우스로수집
_요약
_참고문헌

CHAPTER4RAG특성파이프라인
_4.1RAG이해
_4.2고급RAG개요
_4.3LLMTwin의RAG특성파이프라인아키텍처
_4.4LLMTwin의RAG특성파이프라인구현하기
_요약
_참고문헌

CHAPTER5지도학습파인튜닝
_5.1지시문데이터셋생성
_5.2지시문데이터셋자체생성
_5.3SFT기법
_5.4실전파인튜닝
_요약
_참고문헌

CHAPTER6선호도정렬을활용한파인튜닝
_6.1선호도데이터셋이해
_6.2선호도데이터셋생성
_6.3선호도정렬
_6.4DPO구현
_요약
_참고문헌

CHAPTER7LLM평가
_7.1모델평가
_7.2RAG평가
_7.3TwinLlama-3.1-8B평가
_요약
_참고문헌

CHAPTER8추론최적화
_8.1모델최적화전략
_8.2모델병렬처리
_8.3모델양자화
_요약
_참고문헌

CHAPTER9RAG추론파이프라인
_9.1LLMTwin의RAG추론파이프라인이해
_9.2LLMTwin의고급RAG기법탐구
_9.3LLMTwin의RAG추론파이프라인구현
_요약
_참고문헌

CHAPTER10추론파이프라인배포
_10.1배포유형선택기준
_10.2추론배포유형이해
_10.3모놀리식아키텍처와마이크로서비스아키텍처비교
_10.4LLMTwin의추론파이프라인배포전략탐구
_10.5LLMTwin서비스를배포하기
_10.6급증하는사용량처리를위한오토스케일링
_요약
_참고문헌

CHAPTER11MLOps와LLMOps
_11.1DevOps,MLOps,LLMOps
_11.2LLMTwin파이프라인을클라우드에배포하기
_11.3LLMTwin에LLMOps적용
_요약
_참고문헌

APPENDIXMLOps원칙
_원칙1:자동화또는운영화
_원칙2:버전관리
_원칙3:실험추적
_원칙4:테스트
_원칙5:모니터링
_원칙6:재현가능성

출판사 서평

나만의AI를설계하고구현하며배우는
RAG,파인튜닝(LoRA·QLoRA),FastAPI,LLMOps의모든것

챗GPT는누구나사용할수있지만,모두에게‘맞춤형’은아닙니다.일반적인문체,장황한답변,일관되지않은출력은우리가원하는AI와는다릅니다.이책은단순한모델호출을넘어,나만의디지털AI캐릭터인‘LLMTwin’을직접구현하며실전LLM시스템을개발하는전과정을안내합니다.웹스크래핑으로시작해RAG파이프라인설계,LoRA·QLoRA를활용한파인튜닝,추론최적화,클라우드기반의LLMOps까지,이책은엔드투엔드LLM애플리케이션개발을위한실습형프로젝트로드맵을제공합니다.

이과정에서독자는실제제품수준의시스템을완성하는데필요한데이터설계,인프라구성,배포전략까지모두경험하게됩니다.미디엄,서브스택,깃허브등다양한사이트에서데이터를수집해몽고DB에적재하고,Qdrant를활용해검색성능을최적화하며,FastAPI기반의RESTfulAPI로마이크로서비스구축까지직접구현해볼수있습니다.복잡한LLM기술을단순히설명하는데그치지않고,이를실무에바로적용할수있는형태로풀어낸이책은단순히AI를‘활용’하는것을넘어이제는AI를‘직접만드는’시대에맞춘실전가이드입니다.자신만의LLM시스템을완성하고자하는개발자,AI엔지니어,기술리더에게가장확실한길잡이가되어줄것입니다.