LLM 인 프로덕션 (대규모 언어 모델의 성공적인 제품화 전략)

LLM 인 프로덕션 (대규모 언어 모델의 성공적인 제품화 전략)

$37.22
Description
LLM 기반 애플리케이션을 안전하고 효율적으로 프로덕션에 배포하는 방법을 배우자!

이 실용적인 책은 LLM의 작동 원리, LLM과의 상호작용 방식, 애플리케이션과 LLM의 통합 방법을 풍부한 예제와 함께 명확하게 설명한다. 이 책을 통해 기존 소프트웨어나 머신러닝(ML)과 비교해 LLM이 무엇이 다른지 이해하고, 연구실을 벗어나 실무에서 LLM을 다룰 때의 모범관행들을 익힐 수 있다. 또한 이 책은 흔히 발생하는 문제들을 피하는 데 도움이 되는, 저자들의 경험에서 비롯한 조언도 제공한다.

★ 이 책에서 다루는 내용 ★

◎ LLM의 기본 개념과 기반 기술
◎ 사전 훈련된 LLM을 사용할지, 직접 구축할지 평가하는 방법
◎ LLM의 요구사항을 처리할 수 있도록 ML 플랫폼을 효율적으로 확장하는 방법
◎ LLM의 기초(foundation) 모델을 훈련하고 기존 LLM을 미세조정하는 방법
◎ PEFT와 LoRA 같은 복잡한 아키텍처를 활용해 클라우드와 엣지 기기에 LLM을 배포하는 방법
◎ LLM의 강점을 최대한 활용하면서도 단점을 보완하는 애플리케이션 구축 방법

《LLM 인 프로덕션》은 ML옵스를 활용해서 LLM을 프로덕션에 원활하게 적용하는 데 필요한 핵심적인 통찰을 제공한다. LLM 훈련에 적합한 데이터셋을 확보하는 방법부터 플랫폼 구축, 모델의 거대한 크기에 따른 문제의 해결까지 실질적인 가이드를 담았다. 또한 프롬프트 엔지니어링, 모델 재훈련(retraining), 부하 테스트(load testing), 비용 관리, 보안 강화 등의 실용적인 팁과 기법도 다룬다.
저자

크리스토퍼브루소,매슈샤프

저자:크리스토퍼브루소(ChristopherBrousseau)
크리스토퍼브루소는언어학및현지화배경을가진JPMorganChase의간부급머신러닝엔지니어(machinelearningengineer,MLE)이다.특히국제적초점을맞춘언어학적정보에기반한NLP를전문으로하며,스타트업은물론이고포천500대기업들에서도성공적인ML및데이터제품이니셔티브를이끌었다.

저자:매슈샤프(MatthewSharp)
매슈샤프는데이터과학자출신의엔지니어로,ML옵스분야에경험이많은기술리더(techleader)이다.스타트업과최고수준의기술회사모두에서많은성공적인데이터이니셔티브를이끌었다.매슈는프로덕션환경이어떤모습이든상관없이프로덕션에서머신러닝모델을배포,관리및확장하는것을전문으로한다.

역자:307번역랩
전문번역가의효율적인번역작업을위해초벌번역및자료정리서비스를제공하는번역엔지니어집단이다.급변하는IT분야의가치있는외국서적을발빠르게국내독자에게전달하는데보람을느낀다.

역자:류광
커누스교수의《컴퓨터프로그래밍의예술》시리즈를비롯해90여권의다양한IT전문서를번역한전문번역가이다.이책과연관된번역서로는《파이썬으로배우는자연어처리인액션》《마스터링트랜스포머》《실전!RAG기반생성형AI개발》등이있으며,Manning출판사의《AIAgentsInAction》을번역중이다.홈페이지류광의번역이야기(https://occamsrazr.net)와IT및게임개발정보공유사이트GpgStudy(https://gpgstudy.com)를운영한다.

목차

1장:깨어난단어들:LLM이주목받는이유
1.1LLM이가속하는의사소통
1.2LLM을직접구축할것인가,아니면구매할것인가
__1.2.1구매:잘닦인길
__1.2.2자체구축:덜다듬어진길
__1.2.3경고한마디:지금당장미래를받아들여라
1.3미신타파
요약

2장:LLM의이해:언어모델링심층탐구
2.1언어모델링
2.1.1언어적특징들
__2.1.2기호학
__2.1.3다국어NLP
2.2언어모델링기법들
__2.2.1N-그램과말뭉치기반기법
__2.2.2베이즈기법
__2.2.3마르코프연쇄
__2.2.4연속언어모델링
__2.2.5임베딩
__2.2.6다층퍼셉트론(MLP)
__2.2.7순환신경망(RNN)과장단기메모리(LSTM)네트워크
__2.2.8주의메커니즘
2.3“AttentionIsAllYouNeed”(필요한것은주의뿐이다)
__2.3.1인코더
__2.3.2디코더
__2.3.3트랜스포머
2.4아주큰트랜스포머모델
요약

3장:LLM옵스:LLM을위한플랫폼구축
3.1LLM옵스의소개
3.2LLM의운영에따르는난제들
__3.2.1긴다운로드시간
__3.2.2더긴배포시간
__3.2.3지연시간
__3.2.4GPU관리
__3.2.5텍스트데이터의특수성
__3.2.6토큰한계에의한병목현상
__3.2.7환각으로인한혼란
__3.2.8편향성과윤리적고려사항
__3.2.9보안우려사항
__3.2.10비용관리
3.3LLM옵스의핵심요소
__3.3.1압축
__3.3.2분산컴퓨팅
3.4LLM옵스인프라
__3.4.1데이터인프라
__3.4.2실험추적기
__3.4.3모델레지스트리
__3.4.4특징저장소
__3.4.5벡터데이터베이스
__3.4.6모니터링시스템
__3.4.7GPU지원워크스테이션
__3.4.8배포서비스
요약

4장:LLM을위한데이터엔지니어링:성공을위한준비
4.1기초로서의모델
__4.1.1GPT
__4.1.2BLOOM
__4.1.3라마
__4.1.4위저드
__4.1.5팰콘
__4.1.6비쿠나
__4.1.7돌리
__4.1.8오픈챗
4.2LLM평가
__4.2.1텍스트평가를위한지표들
__4.2.2업계주요벤치마크들
__4.2.3책임있는AI벤치마크들
__4.2.4자체벤치마크개발
__4.2.5코드생성기의평가
__4.2.6모델매개변수평가
4.3LLM을위한데이터
__4.3.1알아야할데이터셋들
__4.3.2데이터정제와준비
4.4텍스트처리
__4.4.1토큰화
__4.4.2임베딩
4.5슬랙데이터셋준비
요약

5장:LLM의훈련:생성기를만드는방법
5.1다중GPU환경
__5.1.1환경설정
__5.1.2라이브러리
5.2기본훈련기법
__5.2.1밑바닥부터훈련하기
__5.2.2전이학습(미세조정)
__5.2.3프롬프팅
5.3고급훈련기법들
__5.3.1프롬프트조정
__5.3.2지식증류를활용한미세조정
__5.3.3RLHF(인간피드백기반강화학습)
__5.3.4전문가혼합(MoE)
__5.3.5LoRA와PEFT
5.4훈련관련팁과트릭
__5.4.1훈련데이터크기에관한참고사항
__5.4.2효율적인훈련
__5.4.3극솟값의함정
__5.4.4초매개변수조정팁
__5.4.5운영체제에관한참고사항
__5.4.6활성화함수조언
요약

6장:LLM서비스만들기:실제가이드
6.1LLM서비스만들기
__6.1.1모델컴파일
__6.1.2LLM저장전략
__6.1.3적응형요청배치처리
__6.1.4흐름제어
__6.1.5응답스트리밍
__6.1.6특징저장소
__6.1.7RAG(검색증강생성)
__6.1.8LLM서비스라이브러리
6.2인프라구축
__6.2.1클러스터준비
__6.2.2자동확장
__6.2.3롤링업데이트
__6.2.4추론그래프
__6.2.5모니터링
6.3프로덕션의난제들
__6.3.1모델갱신및재훈련
__6.3.2부하테스트
__6.3.3지연시간문제해결
__6.3.4자원관리
__6.3.5비용엔지니어링
__6.3.6보안
6.4엣지배포
요약

7장:프롬프트엔지니어링:LLM조련사가되려면
7.1모델프롬프팅
__7.1.1퓨샷프롬프팅
__7.1.2원샷프롬프팅
__7.1.3제로샷프롬프팅
7.2프롬프트엔지니어링의기초
__7.2.1프롬프트의해부
__7.2.2프롬프트초매개변수들
__7.2.3훈련데이터살펴보기
7.3프롬프트엔지니어링도구
__7.3.1랭체인
__7.3.2가이던스
__7.3.3DSPy
__7.3.4다른도구들도있지만…
7.4고급프롬프트엔지니어링기법
__7.4.1LLM에도구제공하기
__7.4.2ReAct
요약

8장:LLM애플리케이션:상호작용경험구축
8.1애플리케이션만들기
__8.1.1프런트엔드에서의스트리밍
__8.1.2대화기록유지
__8.1.3챗봇상호작용기능
__8.1.4토큰카운터
__8.1.5RAG적용
8.2엣지애플리케이션
8.3LLM에이전트
요약

9장:LLM프로젝트만들기:라마3의재구현
9.1메타의라마재구현
__9.1.1토큰화및설정
__9.1.2데이터셋준비,데이터적재,평가,생성
__9.1.3모델아키텍처
9.2간소화된라마3
9.3모델개선
__9.3.1양자화
__9.3.2LoRA
__9.3.3FSDPQLoRA적용
9.4허깅페이스스페이스에모델배포
요약

10장:코딩코파일럿프로젝트만들기:실제로도움이될까?
10.1예제모델
10.2데이터가왕이다
__10.2.1예제벡터DB
__10.2.2예제데이터셋
__10.2.3RAG적용
10.3VS코드확장프로그램만들기
10.4배운교훈과다음단계
요약

11장:라즈베리파이에LLM배포하기:얼마나작게만들수있을까?
11.1라즈베리파이설정
__11.1.1파이이미저를이용한OS이미지준비
__11.1.2파이에연결하기
__11.1.3소프트웨어설치및갱신
11.2모델준비
11.3모델서빙
11.4개선사항
__11.4.1더나은인터페이스
__11.4.2양자화변경
__11.4.3다중모달추가
__11.4.4구글코랩에서모델서빙
요약

12장:프로덕션,끊임없이변화하는풍경:이제시작일뿐이다
12.1전체적인조망
12.2LLM의미래
__12.2.1정부와규제
__12.2.2계속커지는LLM
__12.2.3다중모달공간
__12.2.4데이터셋
__12.2.5환각문제의해결
__12.2.6새로운하드웨어
__12.2.7에이전트의유용성이입증될것이다
12.3마무리의견
요약

부록A:간략한언어학역사
A.1고대언어학
A.2중세언어학
A.3르네상스와근현대언어학
A.420세기초언어학
A.520세기중반과현대언어학

부록B:RLHF(인간피드백기반강화학습)

부록C:다중모달잠재공간

출판사 서평

★이책에서다루는내용★

LLM의기본개념과기반기술
사전훈련된LLM을사용할지,직접구축할지평가하는방법
LLM의요구사항을처리할수있도록ML플랫폼을효율적으로확장하는방법
LLM의기초(foundation)모델을훈련하고기존LLM을미세조정하는방법
PEFT와LoRA같은복잡한아키텍처를활용해클라우드와엣지기기에LLM을배포하는방법
LLM의강점을최대한활용하면서도단점을보완하는애플리케이션구축방법

《LLM인프로덕션》은ML옵스를활용해서LLM을프로덕션에원활하게적용하는데필요한핵심적인통찰을제공한다.LLM훈련에적합한데이터셋을확보하는방법부터플랫폼구축,모델의거대한크기에따른문제의해결까지실질적인가이드를담았다.또한프롬프트엔지니어링,모델재훈련(retraining),부하테스트(loadtesting),비용관리,보안강화등의실용적인팁과기법도다룬다.