LLM 디자인 패턴 - 위키북스 생성형 AI 프로그래밍 23

LLM 디자인 패턴 - 위키북스 생성형 AI 프로그래밍 23

$35.00
저자

켄황

저자:켄황(KenHuang)
켄황은클라우드보안연합의AI안전작업그룹과UN프레임워크산하세계디지털기술아카데미의AISTR(인공지능안전,신뢰,책임)작업그룹에서공동의장을맡고있는인공지능전문가다.DistributedApps.ai의CEO로서생성형AI에관한전문적인컨설팅을수행한다.OWASP의LLM애플리케이션상위10대위험요소와NIST생성형AI작업그룹의주요기여자이며,《BeyondAI》《GenerativeAISecurity》《AgenticAI:TheoriesandPractice》등영향력있는책을저술했다.그는다보스세계경제포럼,ACM,IEEE,RSAC등세계적인행사에서강연한다.또한OpenAI포럼회원이며,OWASPAI취약점점수시스템프로젝트의리더를맡고있다.

역자:최용
한국방송통신대학교에서컴퓨터과학을전공하고,응용소프트웨어개발자와은행전산실운영자를거쳐,소프트웨어컨설턴트로서엔터프라이즈IT시스템운영자동화솔루션구축및기술지원업무를수행했다.현재는IT전문서의저술번역교정작업을하며,새로운기술을실무에적용하는방법을탐구하고인공지능을활용해지식생산과업무환경을효율화하는데관심을두고있다.
누구나챗GPT를활용해자신의이야기를책으로쓸수있게도우려개발한‘BookCreatorGuide’GPT가OpenAI의추천을받아글쓰기부문상위권에올랐으며,대규모언어모델(LLM)API활용법을다룬책《OpenAI,구글Gemini,업스테이지SolarAPI를활용한실전LLM앱개발》(2025,위키북스)이세종도서학술부문에선정됐다.
온라인책공유플랫폼인위키독스에‘전뇌해커’라는필명으로글을게재하고있으며,서울사이버대학교드론로봇융합학과에서마지막학기를보내고있다.

목차

[1부]소개및데이터준비

▣01장:LLM디자인패턴소개
1.1LLM이해하기
__1.1.1언어모델의진화
__1.1.2LLM의핵심기능
1.2디자인패턴이해하기
__1.2.1기원과진화
__1.2.2디자인패턴의핵심원칙
1.3LLM개발을위한디자인패턴
__1.3.1LLM디자인패턴의이점
__1.3.2LLM에디자인패턴을적용할때의도전과제
1.4요약

▣02장:LLM훈련데이터정제
2.1데이터정제의중요성
2.2언어데이터셋에서일반적으로나타나는데이터품질문제
2.3LLM을위한텍스트전처리기법
2.4다국어및부호혼용데이터처리
2.5대규모텍스트말뭉치의중복제거전략
__2.5.1정확한일치중복제거
__2.5.2근사중복탐지
__2.5.3싱글링
__2.5.4지역민감해싱(LSH)
2.6데이터정제파이프라인자동화
2.7데이터검증및품질보증
2.8요약

▣03장:데이터증강
3.1텍스트데이터증강기법
__3.1.1동의어대체
__3.1.2역번역
__3.1.3T5를사용한텍스트생성
3.2기존LLM을활용한데이터생성
3.3다국어데이터증강전략
__3.3.1언어간역번역
__3.3.2다국어T5증강
3.4텍스트증강시의미보존
__3.4.1문장임베딩사용
__3.4.2동의어대체를위한문맥적단어임베딩
3.5증강과데이터품질의균형
__3.5.1품질필터링
__3.5.2휴먼인더루프(HITL)검증
3.6데이터증강의영향평가
__3.6.1당혹도
__3.6.2과업별지표
__3.6.3다양성지표
3.7요약

▣04장:LLM훈련을위한대규모데이터셋처리
4.1대용량데이터셋의도전과제
4.2데이터샘플링기법
4.3분산데이터처리
4.4데이터샤딩및병렬화전략
4.5효율적인데이터저장형식
4.6연속적인LLM훈련을위한스트리밍데이터처리
4.7메모리효율적인데이터로딩기법
4.8요약

▣05장:데이터버전관리
5.1데이터버전관리의필요성이해
5.2대규모언어데이터셋을위한데이터버전관리전략
5.3데이터버전관리를위한도구
5.4훈련워크플로에데이터버전관리통합
5.5텍스트말뭉치의버전관리
5.6데이터셋변형및실험관리
5.7데이터버전관리의모범사례
5.8요약

▣06장:데이터셋주석과라벨링
6.1고품질주석의중요성
6.2다양한과업별주석전략
6.3대규모텍스트주석을위한도구와플랫폼
6.4주석품질관리
6.5크라우드소싱주석의장단점
6.6반자동주석기법
6.7대규모언어데이터셋주석처리기법
6.8주석편향과완화전략
6.9요약

[2부]대규모언어모델의훈련과최적화

▣07장:훈련파이프라인
7.1훈련파이프라인의구성요소
7.2데이터입력및전처리
7.3LLM아키텍처설계고려사항
7.4손실함수와최적화전략
7.5로깅
7.6파이프라인모듈성과재사용성
7.7더큰모델을위한훈련파이프라인확장
7.8요약

▣08장:하이퍼파라미터튜닝
8.1하이퍼파라미터이해하기
8.2수동튜닝과자동튜닝
__8.2.1수동튜닝
__8.2.2자동튜닝
8.3격자탐색과랜덤탐색
8.4베이즈최적화
8.5개체군기반방법
8.6다목표하이퍼파라미터최적화
8.7대규모하이퍼파라미터튜닝의과제와해법
8.8요약

▣09장:정규화
9.1L2정규화(리지회귀)
9.2드롭아웃
9.3레이어별적응형정규화
9.4경사클리핑과노이즈주입
9.5전이학습및파인튜닝시나리오에서의정규화
9.6새로운정규화기법
__9.6.1확률적가중치평균화(SWA)
__9.6.2날카로움을고려한최소화(SAM)
__9.6.3차분프라이버시기반정규화
__9.6.4빠른경사부호방법(FGSM)
__9.6.5룩어헤드옵티마이저
9.7요약

▣10장:체크포인팅과복구
10.1체크포인팅이왜중요한가?
10.2체크포인트빈도및저장전략
10.3효율적인체크포인트저장방식
10.4실패에서회복하기
10.5분산LLM훈련에서의체크포인팅
10.6LLM체크포인트의버전관리
10.7자동화된체크포인팅및복구시스템
10.8요약

▣11장:파인튜닝
11.1전이학습과파인튜닝구현
11.2레이어의동결및해동전략
11.3학습률스케줄링
11.4도메인특화파인튜닝기법
11.5퓨샷제로샷파인튜닝
11.6지속적파인튜닝과파국적망각
11.7요약

▣12장:모델프루닝
12.1크기기반프루닝
12.2구조적프루닝과비구조적프루닝
12.3반복적프루닝기법
12.4훈련중프루닝과훈련후프루닝
12.5프루닝과모델성능의균형
12.6프루닝과다른압축기법결합하기
__12.6.1프루닝과양자화
__12.6.2프루닝과지식증류
12.7요약

▣13장:양자화
13.1기본개념이해
__13.1.1훈련후양자화(PTQ)
13.2혼합정밀도양자화
13.3하드웨어관련고려사항
13.4양자화전략비교
13.5양자화와다른최적화기법결합
__13.5.1프루닝과양자화
__13.5.2지식증류및양자화
13.6요약

[03부]대규모언어모델의평가및해석

▣14장:평가지표
14.1NLU벤치마크
__14.1.1MMLU
__14.1.2SuperGLUE
__14.1.3TruthfulQA
14.2추리및문제해결지표
__14.2.1AI2추리챌린지
__14.2.2GSM8K
14.3코딩및프로그래밍평가
14.4대화능력평가
14.5상식및일반지식벤치마크
14.6그밖의주요벤치마크
14.7맞춤형지표와벤치마크개발
14.8LLM평가결과해석및비교
14.9요약

▣15장:교차검증
15.1사전훈련및파인튜닝데이터분할
__15.1.1사전훈련데이터에대한층화샘플링
__15.1.2파인튜닝데이터를위한시간기반분할
__15.1.3데이터균형을위한오버샘플링및가중치부여기법
15.2퓨샷및제로샷평가전략
__15.2.1퓨샷평가
__15.2.2제로샷평가
15.3도메인및과업일반화
__15.3.1도메인적응평가
__15.3.2과업일반화평가
15.4연속학습평가
15.5교차검증의과제와모범사례
15.6요약

▣16장:해석가능성
16.1어텐션시각화기법
16.2탐침법
16.3기여도분석기법을사용해LLM예측을설명하기
16.4트랜스포머기반LLM의해석가능성
16.5기계론적해석가능성
16.6해석가능성과성능간의균형
16.7요약

▣17장:공정성및편향탐지
17.1편향의유형
17.2LLM텍스트생성및이해를위한공정성지표
17.3편향감지
17.4편향제거전략
17.5공정성을고려한훈련
17.6윤리적고려사항
17.7요약

▣18장:적대적강건성
18.1텍스트적대공격의유형
18.2적대훈련기법
18.3강건성평가
18.4LLM의적대훈련에서의절충점
18.5실제세계에서의함의
18.6요약

▣19장:인간피드백을통한강화학습
19.1RLHF시스템의구성요소
__19.1.1보상모델
__19.1.2정책최적화
19.2RLHF확장하기
19.3언어모델링에서RLHF의한계
19.4RLHF응용
19.5요약

[04부]고급프롬프트엔지니어링기술

▣20장:사고연쇄(CoT)프롬프팅
20.1효과적인CoT프롬프트디자인
20.2문제해결을위한CoT프롬프팅사용
20.3CoT프롬프팅을다른기법과결합하기
20.4CoT프롬프팅출력을평가하기
20.5CoT프롬프팅의한계
20.6미래방향
20.7요약

▣21장:사고트리(ToT)프롬프팅
21.1ToT프롬프트설계
21.2탐색전략
21.3프루닝과평가
21.4다단계문제를해결하기위해ToT적용
21.5구현의도전과제
21.6미래방향
21.7요약

▣22장:추리및실행(ReAct)
22.1랭체인으로ReAct구현
__22.1.1ReAct문서저장소
22.2LCEL로ReAct에이전트구축하기
__22.2.1ReActSingleInputOutputParser설명
__22.2.2AgentExecutor로에이전트를실행
22.3과업을완료하고문제를해결하기
22.4ReAct의성능평가
22.5안전,제어,윤리적고려사항
22.6한계및향후방향
22.7요약

▣23장:무관찰추리(ReWOO)
23.1랭그래프로ReWOO구현하기
23.2ReWOO의장점
23.3품질평가와윤리적고려사항
23.4미래방향
23.5요약

▣24장:반성기법
24.1자기반성을위한프롬프트디자인
24.2반복적개선구현
24.3오류수정
24.4반성의영향평가
24.5효과적인반성구현의과제
24.6미래방향
24.7요약

▣25장:자동다단계추리와도구사용
25.1복잡한과업분해를위한프롬프팅설계
25.2외부도구통합
25.3자동도구선택및사용구현
25.4복잡한문제해결
25.5다단계추리와도구사용평가
25.6도전과제와미래방향
25.7요약

[05부]대규모언어모델에서검색및지식통합

▣26장:검색증강생성
26.1간단한RAG시스템구축
26.2검색을위한임베딩과색인기법
__26.2.1임베딩
__26.2.2색인
__26.2.3임베딩,색인,검색을시연하는예제코드
26.3검색질의작성전략
26.4검색된정보를LLM생성과통합하기
26.5RAG의도전과제와발전방향
26.6요약

▣27장:그래프기반RAG
27.1그래프기반지식표현개요
27.2그래프기반RAG아키텍처설계
27.3그래프임베딩을활용한검색성능향상
27.4그래프구조를사용한질의확장과생성통합
2