LLM 서비스 설계와 최적화 (비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드)

LLM 서비스 설계와 최적화 (비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드)

$32.00
Description
생성형 AI의 경쟁력을 높이는 LLM 최적화 전략
AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있습니다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개합니다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능 저하를 최소화 하면서 비용을 효과적으로 최소화하는 방법을 만나 보세요.
검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공합니다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보세요.
저자

슈레야스수브라마니암

저자:슈레야스수브라마니암ShreyasSubramanian
AWS의수석데이터과학자입니다.아마존내부팀과대기업고객을대상으로생성형AI애플리케이션의대규모구축,튜닝및배포의컨설팅을맡고있습니다.기초모델을위한고급훈련,튜닝및배포기술의최첨단연구개발을담당하며,머신러닝중심의비용최적화워크숍을운영하여클라우드에서인공지능애플리케이션의비용을절감하는법을컨설팅합니다.

역자:김현준
네이버에서웨일브라우저를개발하는엔지니어로웹기술에큰관심을가지고있습니다.크로미움오픈소스에서커미터로활동했으며,최근에는AI기술의놀라운발전흐름을따라가기위해힘쓰고있습니다.특히AI안전에큰관심을두고머신언러닝과같은기술을탐구합니다.

역자:박은주
현재딥러닝분야에서개인정보보호와관련한다양한주제를연구하고있습니다.챗GPT가등장한이후로AI연구의새로운변화가일어남을감지해LLM에대한깊은호기심을품고이분야의탐구를시작하게되었습니다.

목차


CHAPTER1LLM기초
_1.1생성형AI애플리케이션과LLM
_1.2생성형AI애플리케이션의상용화를위한길
_1.3비용최적화의중요성
_1.4요약

CHAPTER2비용최적화를위한튜닝기법
_2.1파인튜닝및커스터마이징
_2.2파라미터효율적파인튜닝(PEFT)
_2.3PEFT의비용및성능에대한영향
_2.4요약

CHAPTER3비용최적화를위한추론테크닉
_3.1추론테크닉소개
_3.2프롬프트엔지니어링
_3.3벡터스토어를이용한캐싱
_3.4긴문서를관리하는체인
_3.5텍스트요약
_3.6효율적인추론을위한배칭프롬프트
_3.7모델최적화방법
_3.8파라미터효율적파인튜닝(PEFT)
_3.9비용및성능영향
_3.10요약

CHAPTER4모델선택과대안
_4.1모델선택의중요성
_4.2효율적인소형모델
_4.3성공적인소형모델사례
_4.4도메인특화모델
_4.5범용모델을활용한프롬프트의성능
_4.6요약

CHAPTER5인프라및배포튜닝전략
_5.1튜닝전략
_5.2하드웨어활용및배치튜닝
_5.3추론가속화도구
_5.4모니터링과옵저버빌리티
_5.5요약

CHAPTER6성공적인생성형AI도입의열쇠
_6.1성능과비용의균형
_6.2생성형AI애플리케이션의미래트렌드
_6.3요약

출판사 서평

이제AI서비스의핵심은최적화!
LLM서비스설계의모든것을배운다!

딥시크처럼적은투자로높은성능을내는LLM이등장하며,AI개발과정에최적화라는키워드가새로이떠올랐습니다.이책은소형모델(SLM)활용법,효과적인프롬프트엔지니어링,파인튜닝,양자화기법까지,효율적인투자로고성능AI서비스를구축하는데필요한실질적인방법론과이론을폭넓게다룹니다.다양한사례와이론을바탕으로,AI기술도입비용문제로고민하는스타트업,기업,개발자들에게깊이있는인사이트를제공합니다.비용은줄이고성능은높이는LLM최적화전략이필요한모든분께실질적인도움이되길바랍니다.

주요내용
LLM의높은계산비용문제를해결하는효과적인기법
비용효율적인생성AI서비스를만드는파인튜닝과추론,양자화기법
소형모델,도메인특화모델등대안모델

대상독자
효율적인AI모델을구축,튜닝,배포하고싶은실무엔지니어
AI서비스에대한비즈니스적인평가를내리려는기획자및결정권자
LLM을비롯한인공지능모델의전반적인기술을알고싶은개발자
생성형AI및LLM을연구하는학생및교수