RAG 마스터: 랭체인으로 완성하는 LLM 서비스 (멀티모달·그래프 RAG·에이전트·파인튜닝까지 | 반양장)

RAG 마스터: 랭체인으로 완성하는 LLM 서비스 (멀티모달·그래프 RAG·에이전트·파인튜닝까지 | 반양장)

$32.61
Description
LLM 서비스 구현의 핵심, RAG
단 한 권으로 끝내는 실전 Advanced RAG의 모든 것!
이 책은 실제 RAG 기반 서비스를 구축해온 현업 개발자 겸 데이터 과학자 4인이 이론과 함께 생생한 실무 중심의 노하우를 담아냈습니다. RAG의 기본 원리부터 다양한 고급 기법과 랭그래프, ReAct 에이전트 활용, 그리고 RAG 성능 향상을 극대화하는 LLM과 임베딩 모델 파인튜닝까지 다룹니다.
랭체인을 활용한 실습 중심 구성으로, 구글 코랩에서 바로 따라 하며 배우고 각 장의 실전 예제를 통해 나만의 RAG 시스템을 완성할 수 있습니다. 기초를 탄탄히 다지고 싶은 입문자부터, 고급 기법으로 LLM 시스템을 완성하고 싶은 실무 개발자까지, 이 책은 지금 가장 필요한 RAG 기술의 모든 것을 체계적으로 안내합니다.
저자

브라이스유,조경아,박수진,김재웅

저자:브라이스유(BryceYoo)
회사에서딥러닝을이용한자연어처리개발업무를하고있는개발자입니다.여러가지현실의문제를GPT와같은언어모델을통해푸는것에관심이많습니다.

저자:조경아
성균관대학교에서데이터사이언스를전공한데이터과학자.기업분석을통해다양한비즈니스인사이트를도출해왔으며,현재는생성형AI기반의챗봇연구와비즈니스솔루션개발을이끌고있다.데이터기반의혁신적의사결정모델을설계하며,AI를효과적으로활용할수있도록돕는데관심이많다.

저자:박수진
컴퓨터공학과데이터사이언스를전공한십여년경력의개발자.데이터엔지니어링과백엔드서비스개발을비롯해,최근에는LLM애플리케이션및머신러닝모델서빙까지업무범위를확장하고있다.

저자:김재웅
강대학교에서공학을전공하고성균관대학교에서데이터사이언스를공부했다.현재는기업내LLM서비스의기획및운영을담당하고있으며,비전공자도LLM을쉽게활용할수있도록돕는방법에깊은관심을두고있다.

목차


추천사
들어가며
이책의구성
실습환경설정

Chapter1랭체인살펴보기
1.랭체인개요
__1.1랭체인주요패키지
__1.2랭체인버전별기능업데이트
__1.3왜랭체인을사용해야하는가?
__1.4랭체인의주요활용사례
2.대규모언어모델
__2.1랭체인vs오픈AIAPI
__2.2대규모언어모델파라미터설정
__2.3랭체인에서사용할수있는주요대규모언어모델
3.랭체인표현언어
__3.1러너블표준인터페이스
__3.2러너블을체인으로연결하는방법
4.프롬프트
__4.1퓨샷프롬프트
__4.2프롬프트허브
5.출력파서
__5.1출력파서의세가지주요메서드
__5.2PydanticOutputParser
__5.3SimpleJsonOutputParser
__5.4JsonOutputParser
6.메모리관리:대화기록유지
__6.1기본적인대화이력전달
__6.2대화이력관리및처리
__6.3자동대화이력관리
__6.4대화이력요약및트리밍

Chapter2검색증강생성기초와실습
1.검색증강생성개요
__1.1텍스트임베딩
__1.2코사인유사도
__1.3랭체인임베딩API활용
2.문서로더
__2.1웹페이지로더
__2.2PDF로더
__2.3CSV로더
3.텍스트분할
__3.1길이와구분자로분할하는재귀적문자텍스트분할
__3.2의미기반으로분할하는시맨틱청킹
4.벡터데이터베이스
__4.1크로마
__4.2파이스
5.RAG챗봇실습
__5.1RAG챗봇구현
__5.2챗봇에스트림릿UI적용

Chapter3멀티모달RAG를활용한복합데이터처리
1.멀티모달RAG개요
__1.1멀티모달RAG란?
__1.2멀티모달RAG가어려운이유
2.멀티모달RAG구현방법
__2.1모든모달리티를동일한벡터공간에포함하기
__2.2모든모달리티를하나의기본모달리티로표현하기
__2.3서로다른모달리티를별도의저장소에서다루기
3.멀티모달RAG실습
__3.1환경설정
__3.2데이터전처리
__3.3멀티-벡터검색기
__3.4멀티모달RAG구현

Chapter4검색과응답을최적화하는RAG고도화전략
1.청킹전략
__1.1부모-자식분할
2.질의변형
__2.1다중질의생성
__2.2가상문서임베딩
3.검색알고리즘
__3.1희소검색
__3.2밀집검색
__3.3앙상블검색
4.문서후처리
__4.1고성능대규모언어모델기반리랭킹
__4.2크로스인코더기반리랭킹
5.확장된RAG방법론
__5.1Self-RAG개요
__5.2Self-RAG구현

Chapter5지식그래프를활용한그래프RAG
1.그래프RAG개요
__1.1기존RAG방식의한계
__1.2지식그래프란?
__1.3그래프RAG의동작과정
2.그래프DB구축
__2.1그래프DB구축과정
__2.2그래프DB구축실습
3.그래프RAG질의
__3.1그래프RAG질의과정
__3.2그래프RAG질의실습
4.Neo4j와랭체인을활용한GraphRAG구현
__4.1.지식그래프와Neo4j통합

Chapter6랭그래프로설계하는RAG파이프라인
1.랭그래프의구성요소
__1.1그래프
__1.2상태
__1.3노드
__1.4에지
2.랭그래프활용
__2.1루프구현하기
__2.2조건문구현하기
__2.3스트리밍
__2.4상태저장하기
__2.5루프개입하기
3.랭그래프실습
__3.1자체교정-RAG
__3.2코드어시스트챗봇

Chapter7리액트에이전트를활용한RAG
1.생각의사슬
2.에이전트RAG
__2.1라이브러리와데이터준비
__2.2에이전트도구만들기
__2.3에이전트프롬프트설정
__2.4에이전트객체생성
__2.5에이전트RAG실습

Chapter8RAG성능을높이는LLM파인튜닝
1.RAFT논문살펴보기
__1.1네거티브샘플
__1.2생각의사슬
2.성능향상을위한팁
__2.1답변없음데이터
__2.2출처인용
3.RAG학습데이터셋살펴보기
__3.1학습데이터소개
__3.2학습데이터탐색
4.로컬LLMQwen파인튜닝하기
__4.1런팟을이용한실습환경설정
__4.2데이터전처리
__4.3Qwen템플릿이해하기
__4.4로라학습을위한설정값
__4.5학습을위한설정값
__4.6정수인코딩
__4.7모델테스트하기
__4.8GPU종료하기

Chapter9임베딩모델파인튜닝
1.임베딩모델의학습원리
__1.1대조학습
__1.2데이터셋구성
__1.3배치내네거티브샘플링
__1.4MultipleNegativesRankingLoss
__1.5학습코드의이해
2.학습시성능을높이는방법
__2.1배치크기키우기
__2.2하드네거티브선정
__2.3그외학습성능향상을위한팁
3.실전파인튜닝
__3.1데이터로드하기
__3.2하드네거티브선정
__3.3합성데이터생성
__3.4모델로드하기
__3.5평가데이터전처리
__3.6모델학습하기
__3.7검색성능평가지표
__3.8파인튜닝모델평가하기

마치며
찾아보기

출판사 서평

멀티모달부터그래프RAG,랭그래프,ReAct에이전트,파인튜닝까지
RAG로완성하는실전LLM서비스

최근챗GPT로대표되는거대언어모델(LLM)은뛰어난성능에도불구하고,최신정보나특정문서의세부내용을제공하지못하는한계가있습니다.이런문제를해결하는대표적인기술이바로RAG(검색증강생성)입니다.
이책은LLM기반서비스를구축하는데꼭필요한RAG의기본원리부터다양한고급기법까지폭넓게다룹니다.기초적인RAG개념뿐아니라멀티모달RAG,그래프RAG,랭그래프를활용한파이프라인,에이전트RAG,파인튜닝등실무에서요구하는심화주제를단계별로안내합니다.또한텍스트임베딩,의미기반텍스트분할,벡터데이터베이스활용등RAG구현에필수적인기술을체계적인이론과실습으로함께다룹니다.이를통해LLM서비스개발이처음인초보자부터실전감각을키우고싶은개발자까지모두에게유용한지식과노하우를제공합니다.
특히이책에서는RAG구현에최적화된프레임워크인랭체인(LangChain)활용법을자세히다룹니다.랭체인은LLM기반의AI애플리케이션을쉽고빠르게개발할수있도록다양한기능과모듈을제공하는강력한프레임워크입니다.
모든예제는구글코랩(GoogleColab)과랭체인을활용하여복잡한환경설정없이누구나손쉽게따라할수있도록구성했습니다.책에서제공하는생생한RAG실습을차근차근따라하다보면,기업데이터기반의챗봇이나지식검색시스템과같은실제비즈니스현장에바로적용가능한AI애플리케이션개발능력을자연스럽게습득하게될것입니다.

이런분께추천!
AI개발에관심이있는초중급파이썬사용자
체인과RAG를학습하고싶은대학생,개발자커뮤니티,연구자
LLM및RAG기반시스템을개발하고자하는개발자및엔지니어
기업데이터기반챗봇및지식검색시스템구축을고려중인실무자

이책의구성
이책은총9장으로구성되어있으며,RAG기술의핵심원리부터실무에적용가능한다양한방법까지단계적으로다룹니다.

1장에서는랭체인의주요개념과기능들을자세히설명합니다.랭체인에서활용하는언어모델의이해부터프롬프트작성법,출력파서활용,메모리관리기법등RAG구현의바탕이되는개념을꼼꼼히다룹니다.

2장에서는본격적으로RAG의기본원리를배우고실습합니다.텍스트임베딩과코사인유사도개념,문서로딩및분할방법,그리고벡터데이터베이스를이용한기본적인챗봇구현과정을따라가면서기초를튼튼하게다집니다.

3장에서는텍스트를넘어이미지등다양한데이터타입을함께활용할수있는멀티모달RAG를살펴봅니다.멀티모달RAG의필요성부터구현방식과실제실습까지진행하며실무에가까운활용법을익힙니다.

4장에서는RAG의성능을높이기위한고급전략을구체적으로학습합니다.효과적인문서분할(청킹)전략과질의변형방법,검색알고리즘과문서리랭킹,그리고이를더욱발전시킨Self-RAG기법까지다룹니다.

5장에서는지식그래프를활용하여RAG의한계를극복하는그래프RAG를소개합니다.Neo4j를활용하여그래프데이터베이스를구축하고이를실제질의에활용하는방법을실습합니다.

6장에서는랭그래프를활용하여RAG시스템을더유연하고정교하게만드는방법을다룹니다.랭그래프의개념과핵심구성요소를이해하고,이를활용한조건문과루프구조등복잡한RAG구현을실습을통해익힙니다.

7장에서는리액트에이전트를활용하여더욱지능적이고자동화된RAG시스템을구현하는방법을설명합니다.에이전트의동작원리를이해하고,에이전트도구제작및실제RAG실습을진행합니다.

8장에서는RAG의성능을더욱높이기위한언어모델의파인튜닝을다룹니다.파인튜닝의필요성과데이터준비방법,학습환경구축및실제로컬LLM모델(Qwen)을파인튜닝하는과정까지상세하게설명하여실무에직접적용가능한수준까지안내합니다.

마지막으로,9장에서는RAG의핵심인검색성능을극대화하기위해임베딩모델을직접파인튜닝하는방법을심층적으로다룹니다.효과적인임베딩학습방법의원리와활용법을배우고,실제데이터를이용한학습데이터구축부터모델훈련,검색성능평가,성능최적화팁까지실전적인지식을습득합니다.