파이썬 AI 애플리케이션 개발 (LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스)

파이썬 AI 애플리케이션 개발 (LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스)

$33.00
Description
"LLM API만 연동하면 끝일까? 진짜 문제는 그다음부터 시작된다."
MongoDB에서 AI와 벡터 검색을 직접 만들고 운영하는 전문가 9명이 전하는 실전 노하우
ChatGPT가 세상을 바꾸고 있다는 건 누구나 안다. 덕분에 너도나도 LLM API를 자사 서비스에 도입하기 시작했다. 그런데 막상 출시하고 나면 뭔가 이상하다. 분명 똑같은 LLM을 쓰는데, 왜 우리 서비스에서는 엉뚱한 답변이 나오고, 없는 정보를 지어내고, 예상치 못한 오류가 발생하는 걸까?

API를 호출하는 건 어렵지 않다. 하지만 그것만으로 실제 서비스에 투입할 수 있는 AI 애플리케이션을 만들 수 있다고 생각한다면, 조만간 한계에 부딪히게 될 것이다. 이 책은 바로 그 한계를 넘는 방법을 알려준다.

이 책의 강점은 저자진에 있다. MongoDB 머신러닝 연구 그룹을 이끄는 토마스 뤼크슈티스, 아틀라스 벡터 검색을 총괄하는 헨리 웰러, 매주 수천 명이 사용하는 MongoDB AI 챗봇을 직접 구축한 벤 펄머터와 니콜라스 라루 등 MongoDB에서 AI와 벡터 검색을 실제로 만들고 운영하는 전문가 9명이 함께 집필했다. 이론이 아닌, 실제 서비스 현장에서 검증된 노하우가 담겨 있다.

Python 기초 지식만 있으면 충분하다. 생성형 AI 시대에 단순한 API 사용자를 넘어, AI 애플리케이션의 구조를 이해하고 직접 구축할 수 있는 개발자로 성장하고 싶다면 이 책에서 시작해보자.
저자

라셸파머

(RachellePalmer)
MongoDB의개발자데이터베이스경험(DeveloperDatabaseExperience)과개발자교육(DeveloperEducation)부문의제품리더이며드라이버클라이언트라이브러리,문서,프레임워크통합,MongoDB대학(MongoDBUniversity)을감독한다.자바,PHP,Rust,파이썬,Node.js,루비(Ruby)로MongoDB용샘플애플리케이션을구축했다.2013년MongoDB에합류했으며,이전에는기술서비스엔지니어링팀의이사로서MongoDB아틀라스(MongoDBAtlas)에각종지원과클라우드운영(CloudOps)을제공하는팀을구성하고관리했다.

목차

1장.GenAI시작하기
기술적요구사항
용어정의
GenAI스택
____파이썬과GenAI
____OpenAIAPI
____벡터검색을사용한MongoDB
GenAI의중요기능
____왜GenAI를사용하는가?
____GenAI의윤리와위험
요약

2장.지능형애플리케이션의블록구축
기술적요구사항
지능형애플리케이션정의
____지능형애플리케이션블록구축
LLM-지능형애플리케이션의추론엔진
____LLM추론엔진의사용사례
____LLM의다양한기능
____멀티모달언어모델
____AI개발의패러다임이동
임베딩모델과벡터데이터베이스-RAG를위한외부지식저장소
____임베딩모델
____벡터데이터베이스
____모델호스팅
사용자지능형애플리케이션
____샘플애플리케이션-RAG챗봇
____소프트웨어엔지니어링의지능형애플리케이션관련시사점
요약

1부.AI의기초:LLM,임베딩모델,벡터데이터베이스,애플리케이션설계

3장.대규모언어모델
기술적요구사항
확률적프레임워크
____n-그램언어모델
언어모델링의머신러닝
____인공신경망
____인공신경망훈련
자연어처리의ANN
____토큰화
____임베딩
____확률분포예측
순차적데이터처리
____순환신경망
____트랜스포머아키텍처
LLM의모범사례
____LLM의진화분야
____프롬프트,미세조정및RAG
요약

4장.임베딩모델
기술적요구사항
임베딩모델이란?
____임베딩모델은LLM과어떻게다를까?
____임베딩모델과LLM을사용해야하는경우
____임베딩모델의종류
임베딩모델선택하기
____작업요구사항
____데이터세트특성
____계산리소스
____벡터표현
____임베딩모델리더보드
____임베딩모델개요
____항상임베딩모델이필요한가?
____LangChain에서코드실행
모범사례
요약

5장.벡터데이터베이스
기술적요구사항
벡터임베딩이란?
____벡터유사도
____정확한검색과대략적인검색방법
____검색측정
그래프연결성
____작은세계탐색
____탐색이가능한작은세계를검색하는방법
____계층적탐색이가능한작은세계
벡터데이터베이스의필요성
____벡터검색이AI모델을개선하는방법
사례연구및실제적용사례
____Okta-자연어액세스요청(시맨틱검색)
____OneAI-언어기반AI(비즈니스데이터를사용한RAG)
____NovoNordisk-자동임상연구생성(고급RAG/RPA)
벡터검색모범사례
____데이터모델링
____적용
요약

6장.AI/ML애플리케이션설계
기술적요구사항
데이터모델링
____임베딩을사용한데이터보강
____검색사용예고려하기
데이터스토리지
____데이터베이스클러스터의유형판별
____IOPS결정
____RAM결정
____최종클러스터구성
____성능과가용성대비용
데이터흐름
____정적데이터원본처리
____벡터임베딩으로보강한운영데이터저장하기
신규성과유지
____실시간업데이트
____데이터수명주기
____새로운임베딩모델채택
보안및RBAC
AI/ML애플리케이션설계를위한모범사례
요약

2부.사용자파이썬애플리케이션만들기:프레임워크,라이브러리,API,벡터검색엔진

7장.유용한프레임워크,라이브러리,API
기술적요구사항
AI/ML파이썬
AI/ML프레임워크
____LangChain
____유사도점수를사용한LangChain시맨틱검색
____사전필터링을사용한시맨틱검색
____LangChain으로기본RAG솔루션구현하기
____LangChain프롬프트템플릿과체인
주요파이썬라이브러리
____pandas
____PyMongoArrow
____PyTorch
AI/MLAPI
____OpenAIAPI
____허깅페이스
요약

8장.AI애플리케이션에서벡터검색구현하기
기술적요구사항
MongoDB아틀라스벡터검색을사용한정보검색
____파이썬의벡터검색튜토리얼
____LangChain을사용한벡터검색튜토리얼
RAG아키텍처시스템구축
____청크와문서분할전략
____간단한RAG
____고급RAG
요약

3부.AI애플리케이션의최적화:확장,미세조정,문제해결,모니터링및분석

9장.LLM출력평가
기술적요구사항
LLM평가란?
____LLM구성요소와엔드투엔드평가
모델벤치마킹
____평가데이터세트
____기준선정의
____사용자피드백
____합성데이터
평가메트릭
____어설션기반메트릭
____통계메트릭
____LLM기반평가
____RAG메트릭
____인적검토
____가드레일로서의평가
요약

10장.시맨틱데이터모델을개선해정확도향상하기
기술적요구사항
임베딩
____다양한임베딩모델로실험하기
____임베딩모델미세조정
임베딩메타데이터
____메타데이터형식지정
____정적메타데이터포함
____프로그래밍방식의메타데이터추출
____LLM으로메타데이터생성
____쿼리임베딩및수집콘텐츠임베딩에서메타데이터포함하기
검색증강생성최적화
____쿼리변형
____사전필터링을위한쿼리메타데이터추출
____수집된데이터형식지정
____고급검색시스템
요약

11장.GenAI의일반적인실패
기술적요구사항
환각
____환각의원인
____환각의의미
아첨
____아첨의원인
____아첨의의미
데이터유출
____데이터유출의원인
____데이터유출의의미
비용
____비용유형
____토큰
GenAI애플리케이션의성능문제
____계산부하
____모델제공전략
____높은I/O작업
요약

12장.GenAI애플리케이션수정및최적화
기술적요구사항
기준선
____훈련과평가데이터세트
____퓨샷프롬프팅
____검색과순위재지정
____늦은상호작용전략
____쿼리재작성
테스트와레드팀구성
____테스트
____레드팀구성
정보후처리
다른해결방법
요약

출판사 서평

AI애플리케이션을만드는모범사례와실전기술완전정복
이책은LLM,벡터데이터베이스,파이썬프레임워크로구성된생성형AI스택의작동원리를처음부터끝까지설명한다.단순히개념을나열하는데그치지않고,각기술이실제애플리케이션에서어떻게맞물려돌아가는지를보여준다.

데이터를어떻게준비해야하는지,어떤모델을선택해야하는지,미세조정은어떻게해야하는지등현장에서바로적용할수있는모범사례를익힌다.환각현상이나데이터유출같은골치아픈문제를해결하기위해검색증강생성(RAG)을MongoDBAtlas와함께구현하는방법도단계별로안내한다.

무엇보다이책은많은입문서가다루지않는영역까지파고든다.LLM이내놓은결과를어떻게평가해야하는지,AI오류는어떻게진단하고수정하는지,성능은어떻게최적화하는지를구체적으로설명한다.이부분을알아야실제서비스에서안정적으로작동하는AI애플리케이션을만들수있다.

이책을읽고나면실제가치를제공하는AI애플리케이션을직접구축할역량을갖추게될것이다.

이책에서다루는내용
ㆍLLM,벡터데이터베이스,파이썬프레임워크로구성된생성형AI스택의구조와작동원리
ㆍ벡터데이터베이스의역할과AI애플리케이션성능향상을위한활용법
ㆍMongoDBAtlas를활용한벡터검색과RAG구현
ㆍLLM출력품질을측정하고개선하는평가방법
ㆍ환각,데이터유출등자주발생하는문제와해결전략