한 권으로 끝내는 실전 LLM 파인튜닝 (개정판)

한 권으로 끝내는 실전 LLM 파인튜닝 (개정판)

$32.00
Description
실무 현장에서 바로 쓰는 파인튜닝ㆍPEFTㆍvLLM 서빙, 텍스트를 넘어 멀티모달까지!
이 책은 AI 기술의 최전선에서 필요한 LLM 파인튜닝의 모든 과정을 이론부터 실습까지 단계별로 안내합니다. Llama 3.1과 Gemma 2 모델을 기반으로 파인튜닝의 핵심 기술을 익히고, 이번 개정판에서 새롭게 추가된 음성 인식(Whisper)과 시각-언어 모델(VLM) 실습을 통해 멀티모달 AI 개발 역량까지 확장할 수 있습니다.

◎ NLP의 역사적 발전과 역전파의 핵심 원리 마스터
◎ GPT 모델의 심층 이해: 셀프 어텐션, 토크나이저 구현부터 실전 응용까지
◎ Gemma 2와 Llama 3.1 모델 분석과 GPU 병렬화 학습
◎ LoRA, QLoRA를 활용한 파인튜닝 기법 실습
◎ vLLM으로 실제 서비스에 적용 가능한 모델 서빙
◎ Whisper 모델을 활용한 한국어 음성 인식(STT) 파인튜닝
◎ Qwen2-VL 모델을 활용한 시각-언어 모델(VLM) 학습 및 실습

Runpod 환경의 실습 프로젝트를 통해 이론과 실무를 동시에 학습할 수 있으며, 단일 GPU부터 다중 GPU 환경까지 실전에서 바로 활용 가능한 노하우를 제공합니다.

책을 읽다가 궁금한 점이 생기면, 저자가 직접 운영하는 커뮤니티에서 질문하고 답변을 받을 수 있습니다.

저자 운영 오픈 채팅방: 카카오톡 오픈채팅에서 ‘NLP & RAG’ 검색
저자

강다솔

GoodGangLabs의AI엔지니어겸연구자로서AI아바타음성대화기술을개발하고있습니다.다국어STT/TTS모델연구와RAG기반상용챗봇시스템구축을주도하며폭넓은기술적경험을축적해왔습니다.

목차

▣01장:NLP의과거와오늘
1.1자연어처리발전의주요이정표
1.2초기기계번역의역사와전환점
__1.2.1아르츠루니와트로얀스키의연구
__1.2.2위버의제안과조지타운-IBM실험
__1.2.3초기기계번역의한계와새로운전환
1.3인공지능의시작
__1.3.1튜링의질문:기계는생각할수있는가?
__1.3.2튜링테스트의한계
1.4인공지능은어떻게학습하는가?
__1.4.1인공지능의학습메커니즘발전과정
__1.4.2퍼셉트론:인공지능학습의첫걸음
1.5역전파알고리즘:학습의혁명
__1.5.1비선형성:더똑똑한인공지능을만드는열쇠
__1.5.2역전파알고리즘
1.6트랜스포머의등장:NLP의새로운시대

▣02장:GPT
2.1런팟소개와사용법
__2.1.1런팟회원가입
__2.1.2크레딧구매
__2.1.3포드구성
__2.1.4주피터랩
2.2데이터준비와모델구성
2.3언어모델만들기
__2.3.1라이브러리설명
__2.3.2__init__함수
__2.3.3forward메서드
__2.3.4generate메서드
2.4Optimizer추가하기
__2.4.1데이터를GPU로전달하기
__2.4.2Loss함수만들기
__2.4.3전체코드복습
2.5셀프어텐션추가하기
__2.5.1문자들간에정보를주고받는방식(평균방식)
__2.5.2행렬곱연산으로더빠르게정보를주고받기
__2.5.3셀프어텐션이란?
__2.5.4왜dk로나눠야하는가?
__2.5.5셀프어텐션적용하기
2.6멀티헤드어텐션과피드포워드
__2.6.1멀티헤드어텐션만들기
__2.6.2피드포워드만들기
2.7Blocks만들기
2.8토크나이저만들기
__2.8.1vocab_size변화에따른토큰화비교
__2.8.2토크나이저만들기

▣03장:전체파인튜닝
3.1전체파인튜닝데이터준비
__3.1.1전체파인튜닝의원리와종류
__3.1.2다양한태스크와데이터셋
__3.1.3데이터전처리
3.2Gemma와Llama3모델구조분석
__3.2.1Gemma모델구조분석
__3.2.2Gemma와Gemma2모델비교
__3.2.3Llama3모델구조분석
__3.2.4GPT,Gemma,Llama비교
3.3GPU병렬화기법
__3.3.1데이터병렬처리
__3.3.2모델병렬화
__3.3.3파이프라인병렬화
__3.3.4텐서병렬처리
__3.3.5FSDP
3.4단일GPU를활용한Gemma-2B-it파인튜닝
__3.4.1런팟환경설정
__3.4.2Gemma모델준비
__3.4.3데이터셋준비
__3.4.4Gemma모델의기능확인하기
__3.4.5키워드데이터생성
__3.4.6데이터전처리
__3.4.7데이터셋분리및콜레이터설정
__3.4.8학습파라미터설정
__3.4.9평가메트릭정의
__3.4.10모델학습및평가
__3.4.11파인튜닝한모델테스트
3.5다중GPU를활용한Llama3.1-8B-instruct파인튜닝
__3.5.1런팟환경설정
__3.5.2Llama3.1학습파라미터설정
__3.5.3데이터셋준비
__3.5.4Llama3.1모델파라미터설정
__3.5.5Llama3.1모델학습코드살펴보기
__3.5.6Llama3.1모델학습실행
__3.5.7Wandb설정과사용
__3.5.8학습한Llama3.1모델테스트
__3.5.9생성된텍스트데이터OpenAI로평가하기
__3.5.10채점점수구하기

▣04장:효율적인파라미터튜닝기법(PEFT)
4.1LoRA이론및실습
__4.1.1LoRA개념
__4.1.2런팟환경설정
__4.1.3Gemma-2-9B-it모델준비
__4.1.4데이터전처리
__4.1.5LoRA파라미터설정
__4.1.6모델학습
__4.1.7학습한모델테스트하기
__4.1.8모델성능을OpenAI로평가하기
4.2QLoRA이론및실습
__4.2.1양자화의이해
__4.2.2런팟환경설정
__4.2.3데이터셋준비
__4.2.4양자화파라미터설정
__4.2.5모델준비
__4.2.6파라미터설정
__4.2.7모델학습
__4.2.8허깅페이스허브에모델업로드
__4.2.9학습한모델테스트
__4.2.10ExactMatch를활용한평가
__4.2.11OpenAIAPI로평가하기

▣05장:vLLM을활용한서빙
5.1페이지드어텐션원리
5.2vLLM사용방법
5.3LLaMA3생성속도가속화
5.4vLLM을활용한Multi-LoRA
__5.4.1Multi-LoRA실습
__5.4.2노트북환경에서실습
5.5Multi-LoRA를사용할때주의할점

▣06장:Whisper파인튜닝
6.1음성인식기술의역사적발전과정
__6.1.1OpenAIWhisper의등장배경
6.2Whisperlarge-v1,v2,v3버전별기술적개선
__6.2.1Whisper아키텍처
__6.2.2멀티태스크학습메커니즘
__6.2.3멜스펙트로그램기술적세부사항
6.3한국어파인튜닝의필요성
__6.3.1한국어음성인식의현실과과제
__6.3.2한국어특유의언어적도전과제
__6.3.3파인튜닝을통한성능개선가능성
6.4Whisper3파인튜닝
__6.4.1음성데이터생성
__6.4.2Whisper모델학습
__6.4.3파인튜닝된Whisper모델로추론하기

▣07장:Vision-LanguageModel파인튜닝
7.1멀티모달의이해
7.2Qwen2-VL소개
__7.2.1NaiveDynamicResolution
__7.2.2M-RoPE(MultimodalRotaryPositionEmbedding)
__7.2.3모델구조와학습과정
__7.2.4모델라인업
7.3Qwen2-VL-Fine-Tuning
__7.3.1데이터
__7.3.2학습하기
__7.3.3LoRA어댑터병합
__7.3.4vLLM소개
__7.3.5마치며

▣부록A:역전파수학적리뷰및코드리뷰
역전파수학적리뷰
역전파코드리뷰
GoogleCloudSDK설치

▣부록B:RunPod에서GoogleCloudSDK설정
GoogleCloud인증및서비스활성화
__두가지인증의차이
__기존인증정보초기화(선택사항)
__초기설정
__CLI계정로그인
__애플리케이션기본인증(ADC)설정
__API서비스활성화
필수라이브러리설치
HuggingFaceCLI로그인
설정확인