LangChain으로 구현하는 LLM - 에이콘 데이터 과학 시리즈

LangChain으로 구현하는 LLM - 에이콘 데이터 과학 시리즈

$35.00
저자

벤아우파스

저자:벤아우파스(BenAuffarth)

컴퓨터신경과학박사학위를가진경험이풍부한데이터과학리더다.테라바이트단위의데이터를분석하고최대64k코어를갖춘슈퍼컴퓨터에서뇌활동을시뮬레이션하며,실험을설계하고수행했다.보험적용응용을처리하는제품화시스템을구축했고,수백만건의문서에대해신경망을훈련시켰다.『MachineLearningforTime-Series』(Packt,2021)와『ArtificialIntelligencewithPythonCookbookPython』(Packt,2020)의저자이며,현재는헤이스팅스다이렉트(HastingsDirect)에서보험분야에몸담고있다.



역자:이병욱

서울과학종합대학원디지털금융주임교수와카이스트겸직교수그리고한국금융연수원겸임교수를맡고있으며,인공지능연구원(AIRI)의부사장으로도재직중이다.카이스트(KAIST)전산학과계산이론연구실에서공부했으며공학을전공한금융전문가로,세계최초의핸드헬드-PC(Handheld-PC)개발에참여해한글윈도우CE1.0과2.0을미국Microsoft본사에서공동개발했다.1999년에는전보험사보험료실시간비교서비스를제공하는핀테크전문회사㈜보험넷을창업했고이후삼성생명을비롯한생명보험사및손해보험사에서CMO(마케팅총괄상무),CSMO(영업및마케팅총괄전무)등을역임하면서혁신적인상품과서비스를개발,총괄했다.인공지능연구원에서머신러닝기반의금융솔루션개발에관련된다양한활동을하고있으며금융위원회,금융정보분석원등에다양한자문을하고있다.

저서로는『비트코인과블록체인,탐욕이삼켜버린기술』(에이콘,2018)과대한민국학술원이2019교육부우수학술도서로선정한『블록체인해설서』(에이콘,2019),2022년문체부세종도서로선정된『돈의정체』(에이콘,2019)그리고한국금융연수원의핀테크전문교재인『헬로,핀테크!』(공저,2020),『헬로,핀테크인공지능편』(2021)등이있다.

목차

1장.생성형AI란무엇인가?
__생성형AI소개
____생성모델이란무엇인가?
____왜지금인가?
__LLM의이해
____GPT란무엇인가?
____다른LLM
____주요플레이어
____GPT모델은어떻게작동할까?
______사전훈련
______토큰화
______스케일링
______조건화
____이러한모델을시험하는방법
__텍스트투이미지모델이란?
__다른영역에서AI가할수있는일
__요약
__문제

2장.LLM응용을위한LangChain
__확률적앵무새를넘어서
____LLM의한계는무엇인가?
____LLM의한계를완화하는방법
____LLM응용이란무엇인가?
__LangChain이란무엇인가?
__LangChain의핵심요소탐색
____체인이란무엇인가?
____에이전트는무엇인가?
____메모리는무엇인가?
____도구란무엇인가?
__LangChain의작동원리
__LangChain과다른프레임워크와의비교
__요약
__문제

3장.LangChain으로시작하기
__이책을위한종속성설정방법
____pip
____Poetry
____Conda
____Docker
__API모델통합탐색
____가짜LLM
____OpenAI
____HuggingFace
____GoogleCloudPlatform
____JinaAI
____Replicate
____그외
____애저
____Anthropic
__로컬모델탐색
____HuggingFaceTransformers
____llama.cpp
____GPT4ALL
__고객서비스를위한애플리케이션구축
__요약
__문제

4장.능력있는비서구축
__팩트체크를통한환각완화
__정보요약
____기본프롬프팅
____프롬프트템플릿
____밀도체인
____맵리듀스파이프라인
____토큰사용량모니터링
__문서에서정보추출
__툴을사용한질문응답
____툴을사용한정보검색
____시각인터페이스구축
__추론전략탐색
__요약
__문제

5장.ChatGPT같은챗봇구축
__챗봇이란무엇인가?
__검색과벡터의이해
____임베딩
____벡터저장소
______벡터인덱싱
______벡터라이브러리
______벡터데이터베이스
__LangChain에서의로딩및검색
____문서로더
____LangChain에서검색기
______kNN검색기
______PubMed검색기
______맞춤형검색기
__챗봇구현
____문서로더
____벡터저장소
____메모리
______대화버퍼
______대화요약기억
______지식그래프저장
______여러메모리메커니즘의병합
______장기일관성
__응답중재
__요약
__문제

6장.생성형AI를이용한소프트웨어개발
__소프트웨어개발과AI
____코드LLM
__LLM을사용한코드작성
____StarCoder
____StarChat
____LLaMa2
____소형로컬모델
__소프트웨어개발자동화
__요약
__문제

7장.데이터과학을위한LLM
__생성모델이데이터과학에미치는영향
__자동화된데이터과학
____데이터수집
____시각화와탐색적데이터분석
____전처리와특징추출
____AutoML
__데이터과학질문에답하기위한에이전트사용
__LLM을사용한데이터탐색
__요약
__질문

8장.LLM사용자정의및출력
__LLM조건화
____조건화기법
______인간피드백을가미한강화학습
______LoRA
______추론시간조건화
__미세조정
____미세조정설정
____오픈소스모델
____상업용모델
__프롬프트공학
____프롬프트기술
______제로샷프롬프팅
______퓨샷러닝
______CoT프롬프팅
______자기일관성
______ToT
__요약
__문제

9장.생성형AI제품화
__LLM애플리케이션의제품화를준비하는방법
____용어
__LLM앱을평가하는방법
____두출력비교
____기준대비비교
____문자열과문맥비교
____데이터셋을대상으로한평가수행
__LLM앱을배포하는방법
____FastAPI웹서버
____Ray
__LLM앱을관찰하는방법
____관찰반응
____관측성도구
____LangSmith
____PromptWatch
__요약
__문제

10장.생성형모델의미래
__생성형AI의현상태
____도전과제
____모델개발에서의추세
____빅테크대소기업
____AGI
__경제적결과
____창의적산업과광고
____교육
____법률
____제조
____의학
____군사
__사회적함의
____오정보와사이버보안
____규제와실행의어려움
__앞으로의길

출판사 서평

이책에서다루는내용

LLM을이해하고강점및한계파악
생성형AI의기본원리와산업동향이해
LangChain을사용해질문응답시스템및챗봇과같은LLM앱개발
트랜스포머모델과어텐션메커니즘이해
Pandas와파이썬을사용해데이터분석및시각화자동화
성능향상을위한프롬프트공학이해
LLM을미세조정하고능력을발휘하기위한도구이해
LangChain을사용해LLM을서비스로배포하고평가전략적용
데이터누출을방지하기위해오픈소스LLM을사용해문서와개인적으로상호작용하는방법

이책의대상독자

개발자,연구자그리고LLM에대해더알고싶어하는모든사람이대상으로하는책이다.명확하고간결하게작성됐으며,실습을통해학습할수있도록다양한코드예제를갖추고있다.

초보자든경험이많은개발자든,LLM과LangChain을최대한이해하고이분야의최신동향을선도하고자하는모든이에게가치있는자원이될것이다.

이책의구성

1장,‘생성형AI란무엇인가?’에서는생성형AI가텍스트,이미지그리고비디오처리를혁신적으로변화시키는데어떻게핵심적인역할을하는지설명한다.LLM과같은생성모델을소개하며,이들의기술적기반과다양한분야에서의변혁적인잠재력을자세히소개한다.이러한모델의이론적배경,신경망,훈련접근방법그리고인간과유사한콘텐츠생성에대해강조하고다룬다.또한인공지능의진화,트랜스포머(Transformer)아키텍처,스테이블디퓨전(StableDiffusion)과같은텍스트에서이미지로의모델그리고음성과비디오응용에대한내용도살펴본다.

2장,‘LLM응용을위한LangChain’에서는LLM의확률적앵무새,즉진정한이해없이언어를모방하는모델을넘어설필요성을강조하고,이를위해LangChain의프레임워크를활용한다.낡은지식,행동제한그리고환각의위험과같은한계를다루며,LangChain이외부데이터와개입을통합해더일관된AI애플리케이션을어떻게구현하는지강조한다.2장은확률적앵무새의개념에비판적으로관여해,유창하지만의미없는언어를생성하는모델의결핍을소개하고프롬프팅,사고과정체인,검색기반의논리가어떻게LLM을강화해맥락,편향그리고불투명성과관련된문제를해결하는지설명한다.

3장,‘LangChain으로시작하기’에서는이책의모든예제를실행하기위해환경을설정하는데필요한기본지식을제공한다.Docker,Conda,Pip,Poetry설치안내부터시작하며,OpenAI의ChatGPT와HuggingFace와같은다양한공급업체로부터모델을통합하는방법과필요한API키를얻는과정을설명한다.또한오픈소스모델을로컬에서실행하는방법도다룬다.아울러LangChain을사용해고객서비스에이전트를지원하는LLM앱을만들어LangChain이작업을간소화하고응답의정확도를향상시킬수있는예시를보여준다.

4장,‘능력있는비서구축’에서는LLM을신뢰할수있는비서로변환하는데에관여해,잘못된정보를줄이기위해사실확인을진행하고,요약을위한정교한프롬프팅전략을사용하며,향상된지식을위해외부도구를통합한다.정보추출을위한밀도체인(ChainofDensity)을탐구하고LangChain데코레이터와표현언어에대한논의를통해사용자맞춤형행동을정의하는방법을설명한다.또한LangChain에서긴문서를처리하기위한맵리듀스(map-reduce)를소개하고,API사용비용을관리하기위한토큰모니터링에대한내용도다룬다.
이부분은Streamlit애플리케이션을구현해대화형LLM애플리케이션을만들고,함수호출과도구사용을통해기본텍스트생성을뛰어넘는것에중점을두고있다.“plan-and-solve”및“제로샷(zero-shot)”이라는두가지명확한에이전트패러다임을구현해의사결정전략을시연하는데사용된다.

5장,‘ChatGPT같은챗봇구축’에서는ChatGPT와같은챗봇의능력을향상시키기위해검색증강생성과같은방법을다룬다.이방법은LLM에외부지식에접근할수있는기능을제공해정확성과도메인특화능력을향상시킨다.특히문서벡터화,효율적인색인화,Milvus와Pinecone과같은벡터데이터베이스를사용한의미적검색등을알아본다.책에서는챗봇을구현하면서책임있는의사소통을보장하기위해모더레이션체인(moderationchains)을포함시켰다.이챗봇은깃허브에서사용가능하며,대화메모리(memory)및컨텍스트관리와같은고급주제를탐구하는기반자료로사용된다.

6장,‘생성형AI를이용한소프트웨어개발’에서는소프트웨어개발에서부상하는LLM의역할을조사하며,AI가코딩작업을자동화하고동적코딩비서로서의역할가능성을강조한다.AI기반소프트웨어개발의현재상태를탐구하고,코드일부를생성하기위한모델실험을진행하며,LangChain을사용한자동소프트웨어개발에이전트를위한디자인을소개한다.에이전트의성능에대한비판적인고찰은실수완화그리고고수준디자인을위한인간감독(humanoversight)의중요성을강조하며,AI와인간개발자가상호작용하는미래를준비한다.

7장,‘데이터과학을위한LLM’에서는생성형AI와데이터과학의공통점을탐색하며,LLM이생산성을향상시키고과학적발견을촉진할수있는잠재력에초점을맞춘다.AutoML을통한데이터과학의현재자동화범위에대한개요를제공하고,이를확장해LLM에통합해데이터셋보강과실행가능한코드생성등의고급작업을수행하는개념을소개한다.LLM이탐색적데이터분석,SQL쿼리실행,통계데이터시각화를수행하는실용적인방법을다룬다.마지막으로에이전트와도구사용을이용해LLM이복잡한데이터중심질문에대응하는방법을보여준다.

8장,‘LLM사용자정의및그출력’에서는미세조정(fine-tuning)과프롬프팅(prompting)과같은조건화기술을살펴본다.이는LLM의성능을복잡한추론과특수작업에맞게조정하는데필수적이다.미세조정은LLM이작업별데이터로더많은훈련을받는것을다루며,프롬프트공학(promptengineering)은LLM을원하는출력을생성하도록전략적으로안내한다.퓨샷(few-shot)러닝과사고체인(chain-of-thought)과같은고급프롬프팅전략이구현돼LLM의추론능력을향상시킨다.미세조정과프롬프팅에관한구체적인예제뿐만아니라LLM의미래발전과해당분야에서의응용에대해서도설명한다.

9장,‘생성형AI제품화’에서는LLM을실제애플리케이션내에서배치하는데있어서의복잡성과함께성능보장,규제요구사항충족,규모에대한강건성및효과적인모니터링을위한모범사례를다룬다.평가,관측가능성과체계적인운영의중요성을강조해생성형AI가고객참여와재정적영향이있는의사결정에서유용하게사용될수있도록한다.또한FastAPI,Ray,LangServe,LangSmith와같은도구를사용해LLM앱의배포와지속적인모니터링에대한실용적인전략에대한개요를설명한다.이러한도구는다양한분야에서생성형AI의책임있는채택을지원하는자동평가와분석을제공할수있다.

10장,‘생성형모델의미래’에서는생성형AI의잠재적인발전과사회기술적도전에대해다룬다.10장은이러한기술이경제와사회에미치는영향을검토하며직업이동,잘못된정보그리고인간가치조정과같은윤리적고민을살펴본다.다양한분야에서AI가유발한혼란과변화에대비하는가운데기업,법조인그리고기술자들이효과적인지배프레임워크를형성하는책임에대해고찰한다.이마지막장은AI개발을인간잠재력증대로이끄는동시에딥페이크,편향그리고AI무기화와같은위험에대처해야하는중요성을강조한다.즉투명성,윤리적배치,공정한접근을이끌기위한촉박함을강조한다.

지은이의말

동적이며빠르게발전하는AI분야에서생성형AI는기술과의상호작용방식을변형할것으로예상되는혁신적인힘을가졌다는점에서두드러진다.이책은개발자,연구자그리고AI애호가가이러한도구를활용하는데있어필요한지식을제공하기위해디자인된LLM이라는복잡한세계로의탐험이다.

딥러닝의심연으로진입해비정형데이터가살아움직이는곳에서GPT-4와같은LLM이어떻게AI가비즈니스,사회그리고개인에미치는영향을개척하는지발견해보라.이러한모델의능력과잠재력이기술산업과미디어에서계속해서화제가되는동안,이들이어떻게작동하며어떻게번창하고어떻게우리를미래의지평으로나아가게하는지탐험할수있는좋은순간이다.

이책은여러분이LLM을지탱하는기술적인프레임워크를이해하도록안내하는나침반역할을한다.LLM의광범위한응용분야,그기반이되는아키텍처의우아함그리고그존재의강력한함의에대한전례를제공한다.AI초보자부터경험이풍부한개발자까지다양한독자를대상으로쓰인이책은이론적인개념과실제적인코드예제를융합해,LLM을인지적으로이해할뿐만아니라창의적이고책임감있게적용할수있도록준비해준다.

우리가함께이여정을시작하면서,지식과통찰력을갖추고있는여러분은현재진행중인생성형AI서술에영감을받아자아를형성하고구성할수있도록준비해보라.여러분은이흥미진진한진화의최전선에서있으며,놀라운기술적발전의중심에서게될것이다.

옮긴이의말

최근주목받는생성형인공지능에관한책으로,특히LLM을집중적으로분석한다.LLM을실질적으로활용할수있는여러프레임워크중LangChain을사용하는방법을자세히소개한책으로,실용적인LLM활용입문서라고할수있다.또한LangChain을활용한생성형AI의실제적인구현예제는물론이미지,음성등여러분야에서부각되고있는다양한생성형AI의특징과장단점,현재기술수준등에대해비교하고설명해주는개괄적인입문서로도움이된다.생성형인공지능,그중에서도특히LLM에대한전체개괄을빠르게얻고자하는독자라면이책이좋은출발점이될것이다.