한 권으로 끝내는 실전 LLM 파인튜닝 : GPT 작동 원리부터 Gemma 2 / Llama 3 파인튜닝, vLLM 서빙까지

한 권으로 끝내는 실전 LLM 파인튜닝 : GPT 작동 원리부터 Gemma 2 / Llama 3 파인튜닝, vLLM 서빙까지

$28.00
Description
실무 현장에서 꼭 필요한 파인튜닝, PEFT, vLLM 서빙 기술을 직접 실습하면서 배워 보자!
AI 기술의 최전선에서 배우는 LLM 파인튜닝의 모든 것! 이론적 토대부터 실전 활용까지 단계별로 마스터할 수 있습니다.

◎ NLP의 역사적 발전과 역전파의 핵심 원리 마스터
◎ GPT 모델의 심층 이해: 셀프 어텐션, 토크나이저 구현부터 실전 응용까지
◎ Gemma 2와 Llama 3 최신 모델 분석과 GPU 병렬화 학습
◎ LoRA, QLoRA를 활용한 파인튜닝 기법 실습
◎ vLLM으로 실제 서비스에 적용 가능한 모델 서빙

Runpod 환경의 실습 프로젝트를 통해 이론과 실무를 동시에 학습할 수 있으며, 단일 GPU부터 다중 GPU 환경까지 실전에서 바로 활용 가능한 노하우를 제공합니다.

저자

강다솔

저자:강다솔
구글부트캠프1기수료를시작으로,하나은행챗봇프로젝트와함께금융,로봇,교육등다양한분야에서AI프로젝트를수행했습니다.자연어처리(NLP)와멀티모달분야에깊은관심을가지고있으며,현재는실전경험을바탕으로LLM파인튜닝기술연구에집중하고있습니다.

목차


01장:NLP의과거와오늘
1.1자연어처리발전의주요이정표
1.2초기기계번역의역사와전환점
__1.2.1아르츠루니와트로얀스키의연구
__1.2.2위버의제안과조지타운-IBM실험
__1.2.3초기기계번역의한계와새로운전환
1.3인공지능의시작
__1.3.1튜링의질문:기계는생각할수있는가?
__1.3.2튜링테스트의한계
1.4인공지능은어떻게학습하는가?
__1.4.1인공지능의학습메커니즘발전과정
__1.4.2퍼셉트론:인공지능학습의첫걸음
1.5역전파알고리즘:학습의혁명
__1.5.1비선형성:더똑똑한인공지능을만드는열쇠
__1.5.2역전파알고리즘
1.6트랜스포머의등장:NLP의새로운시대

02장:GPT
2.1런팟소개와사용법
__2.1.1런팟회원가입
__2.1.2크레딧구매
__2.1.3포드구성
__2.1.4주피터랩
2.2데이터준비와모델구성
2.3언어모델만들기
__2.3.1라이브러리설명
__2.3.2__init__함수
__2.3.3forward메서드
__2.3.4generate메서드
2.4Optimizer추가하기
__2.4.1데이터를GPU로전달하기
__2.4.2Loss함수만들기
__2.4.3전체코드복습
2.5셀프어텐션추가하기
__2.5.1문자들간에정보를주고받는방식(평균방식)
__2.5.2행렬곱연산으로더빠르게정보를주고받기
__2.5.3셀프어텐션이란?
__2.5.4왜dk로나눠야하는가?
__2.5.5셀프어텐션적용하기
2.6멀티헤드어텐션과피드포워드
__2.6.1멀티헤드어텐션만들기
__2.6.2피드포워드만들기
2.7Blocks만들기
2.8토크나이저만들기
__2.8.1vocab_size변화에따른토큰화비교
__2.8.2토크나이저만들기

03장:전체파인튜닝
3.1전체파인튜닝데이터준비
__3.1.1전체파인튜닝의원리와종류
__3.1.2다양한태스크와데이터셋
__3.1.3데이터전처리
3.2Gemma와Llama3모델구조분석
__3.2.1Gemma모델구조분석
__3.2.2Gemma와Gemma2모델비교
__3.2.3Llama3모델구조분석
__3.2.4GPT,Gemma,Llama비교
3.3GPU병렬화기법
__3.3.1데이터병렬처리
__3.3.2모델병렬화
__3.3.3파이프라인병렬화
__3.3.4텐서병렬처리
__3.3.5FSDP
3.4단일GPU를활용한Gemma-2B-it파인튜닝
__3.4.1런팟환경설정
__3.4.2Gemma모델준비
__3.4.3데이터셋준비
__3.4.4Gemma모델의기능확인하기
__3.4.5키워드데이터생성
__3.4.6데이터전처리
__3.4.7데이터셋분리및콜레이터설정
__3.4.8학습파라미터설정
__3.4.9평가메트릭정의
__3.4.10모델학습및평가
__3.4.11파인튜닝한모델테스트
3.5다중GPU를활용한Llama3.1-8B-instruct파인튜닝
__3.5.1런팟환경설정
__3.5.2Llama3.1학습파라미터설정
__3.5.3데이터셋준비
__3.5.4Llama3.1모델파라미터설정
__3.5.5Llama3.1모델학습코드살펴보기
__3.5.6Llama3.1모델학습실행
__3.5.7Wandb설정과사용
__3.5.8학습한Llama3.1모델테스트
__3.5.9생성된텍스트데이터OpenAI로평가하기
__3.5.10채점점수구하기

04장:효율적인파라미터튜닝기법(PEFT)
4.1LoRA이론및실습
__4.1.1LoRA개념
__4.1.2런팟환경설정
__4.1.3Gemma-2-9B-it모델준비
__4.1.4데이터전처리
__4.1.5LoRA파라미터설정
__4.1.6모델학습
__4.1.7학습한모델테스트하기
__4.1.8모델성능을OpenAI로평가하기
4.2QLoRA이론및실습
__4.2.1양자화의이해
__4.2.2런팟환경설정
__4.2.3데이터셋준비
__4.2.4양자화파라미터설정
__4.2.5모델준비
__4.2.6파라미터설정
__4.2.7모델학습
__4.2.8허깅페이스허브에모델업로드
__4.2.9학습한모델테스트
__4.2.10ExactMatch를활용한평가
__4.2.11OpenAIAPI로평가하기

05장:vLLM을활용한서빙
5.1페이지드어텐션원리
5.2vLLM사용방법
5.3LLaMA3생성속도가속화
5.4vLLM을활용한Multi-LoRA
__5.4.1Multi-LoRA실습
__5.4.2노트북환경에서실습
5.5Multi-LoRA를사용할때주의할점

부록
역전파수학적리뷰
역전파코드리뷰

출판사 서평

실무현장에서꼭필요한파인튜닝,PEFT,vLLM서빙기술을직접실습하면서배워보자!

AI기술의최전선에서배우는LLM파인튜닝의모든것!이론적토대부터실전활용까지단계별로마스터할수있습니다.

*NLP의역사적발전과역전파의핵심원리마스터
*GPT모델의심층이해:셀프어텐션,토크나이저구현부터실전응용까지
*Gemma2와Llama3최신모델분석과GPU병렬화학습
*LoRA,QLoRA를활용한파인튜닝기법실습
*vLLM으로실제서비스에적용가능한모델서빙

Runpod환경의실습프로젝트를통해이론과실무를동시에학습할수있으며,단일GPU부터다중GPU환경까지실전에서바로활용가능한노하우를제공합니다.