핸즈온 LLM: 프롬프트 엔지니어링부터 임베딩, 시맨틱 검색, 미세 튜닝까지, 손에 잡히는 LLM 개념

핸즈온 LLM: 프롬프트 엔지니어링부터 임베딩, 시맨틱 검색, 미세 튜닝까지, 손에 잡히는 LLM 개념

$38.00
Description
LLM, 눈으로 익히고 손으로 구현하라.
트랜스포머 구조부터 시맨틱 검색, 미세 튜닝, 프롬프트 엔지니어링까지
그림과 실전 코드로 만들면서 배우는 대규모 언어 모델의 모든 것
이 책은 LLM을 쓰는 것을 넘어, 이해하고 구현하는 것까지 나아가고 싶은 이를 위한 실전 가이드입니다. 직관적인 시각 자료와 예제를 제공해 ‘왜 이런 구조가 필요한지’ 이해하고 실용적인 도구와 개념을 익힐 수 있도록 구성했습니다. 사전 훈련된 대규모 언어 모델을 사용하는 방법과 시맨틱 검색 시스템을 만드는 방법, 텍스트 분류, 검색, 클러스터링을 위해 사전 훈련된 모델과 각종 라이브러리를 사용하는 방법을 배웁니다.

● 텍스트 생성과 표현에 뛰어난 트랜스포머 언어 모델의 구조
● 텍스트 문서를 그룹화하고 주제를 파악하는 고급 LLM 파이프라인
● 밀집 검색과 재순위 결정 같은 방법으로 키워드 검색을 넘어서는 의미 검색 엔진 구축
● 프롬프트 엔지니어링부터 검색 증강 생성까지 생성 모델 활용법
● 미세 튜닝, 생성적 사전 학습, 문맥 학습 같은 기술로 특정 용도에 맞게 LLM을 훈련하고 최적화하는 방법
저자

제이알아마르,마르턴흐루턴도르스트

JayAlammar
코히어(Cohere)(대규모언어모델을API로제공하는선두업체)의이사이자엔지니어링펠로(fellow)입니다.언어모델을실용적으로사용하는방법을기업과개발자커뮤니티에조언하고교육하는일을합니다.유명한그의AI/ML블로그(https://jalammar.github.io)를통해수백만명의연구자와엔지니어들이머신러닝도구는물론이고(넘파이와판다스같은패키지문서에수록된)기본지식부터(트랜스포머,BERT,GPT-3,스테이블디퓨전같은)최신개념까지폭넓게이해하는데도움을주고있습니다.제이는Deeplearning.ai와Udacity에서인기있는머신러닝코스와자연어처리코스를제작한이력도있습니다.

목차

1부언어모델이해하기

1장대규모언어모델소개
_1.1언어AI란?
_1.2언어AI의최근역사
_1.3‘대규모언어모델’의정의
_1.4대규모언어모델의훈련패러다임
_1.5대규모언어모델애플리케이션:왜유용한가요?
_1.6책임있는LLM개발과사용
_1.7자원이부족해도괜찮습니다.
_1.8대규모언어모델인터페이스
_1.9첫번째텍스트생성하기
_1.10요약

2장토큰과임베딩
_2.1LLM토큰화
_2.2토큰임베딩
_2.3텍스트임베딩(문장과전체문서)
_2.4LLM을넘어활용되는단어임베딩
_2.5추천시스템을위한임베딩
_2.6요약

3장대규모언어모델자세히살펴보기
_3.1트랜스포머모델개요
_3.2트랜스포머아키텍처의최근발전사항
_3.3요약

2부사전훈련된언어모델사용하기

4장텍스트분류
_4.1영화리뷰데이터셋
_4.2표현모델로텍스트분류하기
_4.3모델선택
_4.4작업에특화된모델사용하기
_4.5임베딩을활용하여분류작업수행하기
_4.6생성모델로텍스트분류하기
_4.7요약

5장텍스트클러스터링과토픽모델링
_5.1아카이브논문:계산및언어
_5.2텍스트클러스터링을위한파이프라인
_5.3텍스트클러스터링에서토픽모델링으로
_5.4요약

6장프롬프트엔지니어링
_6.1텍스트생성모델사용하기
_6.2프롬프트엔지니어링소개
_6.3고급프롬프트엔지니어링
_6.4생성모델을사용한추론
_6.5출력검증
_6.6요약

7장고급텍스트생성기술과도구
_7.1모델I/O:랭체인으로양자화된모델로드하기
_7.2체인:LLM의능력확장하기
_7.3메모리:대화를기억하도록LLM돕기
_7.4에이전트:LLM시스템구축하기
_7.5요약

8장시맨틱검색과RAG
_8.1시맨틱검색과RAG소개
_8.2언어모델을사용한시맨틱검색
_8.3RAG
_8.4요약

9장멀티모달대규모언어모델
_9.1비전트랜스포머
_9.2멀티모달임베딩모델
_9.3텍스트생성모델을멀티모달로만들기
_9.4요약

3부언어모델훈련및미세튜닝

10장텍스트임베딩모델만들기
_10.1임베딩모델
_10.2대조학습이란?
_10.3SBERT
_10.4임베딩모델만들기
_10.5임베딩모델미세튜닝
_10.6비지도학습
_10.7요약

11장분류용표현모델미세튜닝하기
_11.1지도분류
_11.2퓨샷분류
_11.3마스크드언어모델링으로미세튜닝계속하기
_11.4개체명인식
_11.5요약

12장생성모델미세튜닝하기
_12.1LLM훈련의세단계:사전훈련,지도학습미세튜닝,선호도튜닝
_12.2지도학습미세튜닝
_12.3QLoRA를사용한지시기반튜닝
_12.4생성모델평가
_12.5선호도튜닝/정렬/RLHF
_12.6보상모델을사용한선호도평가자동화
_12.7DPO를사용한선호도튜닝
_12.8요약

마치며

출판사 서평

대규모언어모델(LLM)이인류의소통방식을근본적으로바꾸고있습니다.기계가인간의언어를이해하고생성하는능력은AI기술의새지평을열었을뿐아니라,산업전반에혁신의바람을불러일으키고있습니다.
이책은시각적접근법으로복잡한LLM의세계를명쾌하게안내합니다.딥러닝이전단순한단어표현방식부터최신트랜스포머아키텍처까지,LLM의발전과정을한눈에파악할수있습니다.독자는LLM의내부작동원리를이해하고,그구조와훈련방법,다양한미세튜닝기법을직접탐험하게됩니다.
실용적인응용에중점을둔이책은텍스트분류,클러스터링,토픽모델링부터챗봇과검색엔진구축까지다양한LLM응용사례를상세히다룹니다.직관적인설명과시각적도해,실전코드가조화롭게어우러져독자가쉽게이해할수있습니다.
AI와언어모델에첫발을내딛는입문자부터더깊은이해를추구하는전문가까지,흥미진진한LLM의세계로여러분을초대합니다.이책과함께라면누구나LLM의무한한가능성을직접경험할수있을것입니다.

이책의구성
1부:언어모델이해하기
● 소규모및대규모언어모델의내부동작원리
● 언어모델의두가지핵심요소:토큰화와임베딩
● 그림으로살펴보는트랜스포머의모델구조

2부:사전훈련된언어모델사용하기
● 지도학습분류
● 텍스트클러스터링과토픽모델링
● 임베딩모델활용한시맨틱검색
● 텍스트생성모델
● 비전도메인에언어모델사용하는방법

3부:언어모델훈련및미세튜닝
● 임베딩모델을만들고미세튜닝하는방법
● 분류를위해BERT를미세튜닝하는방법
● 생성모델을미세튜닝하는방법

대상독자
● 챗GPT같은AI서비스가어떻게작동하는지궁금하신분
● NLP프로젝트를시작하려는학생및개발자
● AI를활용한비즈니스모델을고민하는실무자