NLP와 LLM 실전 가이드 : 기초 수학부터 실전 AI 문제 해결까지
Description
LLM 시대의 NLP는 선택이 아닌, 필수!
자연어 처리의 모든 기술을 마스터한다!
NLP(자연어 처리)를 마스터하고 싶지만 어디서부터 시작해야 할지 고민인가요? 이 책은 정확하고 올바른 출발점을 제시합니다. 머신러닝과 NLP 분야의 선도자들이 집필한 이 책은 NLP를 깊이 있게 다룹니다.
이 책은 머신러닝의 수학적 기초부터 시작해 LLM과 AI 응용 프로그램 같은 고급 NLP 기술로 점차 나아갑니다. 선형대수학, 최적화, 확률론, 통계학 등 머신러닝과 NLP 알고리즘을 이해하고 구현하는 데 필수적인 기초 개념을 익힐 수 있습니다. 또한 일반적인 머신러닝 기법을 살펴보며, 이를 NLP와 어떻게 연결할 수 있는지도 설명합니다.
이어 텍스트 데이터를 전처리하는 방법, 데이터를 분석하기 위해 정리하고 준비하는 과정 그리고 텍스트 분류를 수행하는 방법을 설명합니다. 이 모든 내용을 파이썬 코드 샘플과 함께 제공합니다.
책의 후반부에서는 LLM의 이론, 설계, 응용과 같은 고급 주제를 심도 있게 논의하며, NLP의 미래 동향에 대한 전문가 의견도 제공합니다. 또한 실제 NLP 비즈니스 사례와 솔루션을 통해 실무 능력을 키울 수 있도록 도와줍니다.

저자

리오르가지트,메이삼가파리

저자:리오르가지트(LiorGazit)
머신러닝분야에서검증된성공사례를가진전문가로,머신러닝을통해비즈니스성장을견인하는팀을구성하고이끈경험이있습니다.자연어처리전문가로서혁신적인머신러닝파이프라인과제품을성공적으로개발했습니다.
석사학위를취득하였으며,동료평가를거친학술지와학회에다수의연구결과를발표했습니다.금융분야머신러닝그룹의수석디렉터이자신생스타트업의수석머신러닝자문위원으로서업계에서풍부한지식과경험을바탕으로존경받는리더로자리매김하고있습니다.머신러닝에대한열정과영감을바탕으로조직에긍정적인변화와성장을이끌어내기위해전념하고있습니다.

저자:메이삼가파리(MeysamGhaffari)
자연어처리와딥러닝에강점을가진수석데이터과학자입니다.현재MSKCC에서근무하며의료문제를해결하기위한머신러닝과자연어처리모델의개발과최적화에전념하고있습니다.머신러닝분야에서9년이상,자연어처리와딥러닝분야에서4년이상의실무경험을보유하고있습니다.플로리다주립대학교에서컴퓨터과학박사학위를,이스파한공과대학교에서컴퓨터과학-인공지능석사학위를,이란과학기술대학교에서컴퓨터과학학사학위를취득했습니다.MSKCC에합류하기전에는위스콘신-매디슨대학교에서박사후연구원으로근무했습니다.

역자:박조은
‘오늘코드’유튜브채널을운영하고있으며,파이썬분야의마이크로소프트MVP로활동하고있습니다.웹과백엔드개발자로게임과광고회사에서주로근무했으며,다양한도메인의기업에서강의와프로젝트를진행했습니다.또한다수의대학교와교육기관에서강의를진행하고있습니다.『모두의한국어텍스트분석with파이썬』(길벗,2023)의공저자이기도합니다.

목차

CHAPTER1자연어처리개요살펴보기
_1.1이책의대상
_1.2자연어처리란?
_1.3컴퓨터연산을위한자연어처리기본접근전략
_1.4성공적인시너지효과:자연어처리와머신러닝의만남
_1.5자연어처리의수학및통계
_1.6요약
_1.7질문과답변

CHAPTER2머신러닝과자연어처리를위한선형대수,확률,통계마스터하기
_2.1선형대수학입문
_2.2고윳값과고유벡터
_2.3머신러닝을위한기본확률
_2.4요약
_2.5더알아보기

CHAPTER3자연어처리에서머신러닝잠재력발휘하기
_3.1기술적요구사항
_3.2데이터탐색
_3.3일반적인머신러닝모델
_3.4모델과소적합과과대적합
_3.5데이터분할
_3.6하이퍼파라미터튜닝
_3.7앙상블모델
_3.8불균형데이터다루기
_3.9상관계수다루기
_3.10요약

CHAPTER4자연어처리성능을위한텍스트전처리과정최적화
_4.1기술요구사항
_4.2자연어처리에서소문자변환
_4.3특수문자와구두점제거
_4.4개체명인식
_4.5품사태깅
_4.6전처리파이프라인설명
_4.7요약

CHAPTER5텍스트분류강화:전통적인머신러닝기법활용하기
_5.1기술요구사항
_5.2텍스트분류의유형
_5.3TF-IDF를활용한텍스트분류
_5.4Word2Vec을활용한텍스트분류
_5.5토픽모델링:비지도텍스트분류의특정사례
_5.6주피터노트북을활용한자연어처리분류를위한머신러닝시스템설계검토
_5.7요약

CHAPTER6텍스트분류의재해석:딥러닝언어모델깊게탐구하기
_6.1기술요구사항
_6.2딥러닝기본이해
_6.3다양한신경망아키텍처
_6.4신경망훈련의도전과제
_6.5언어모델
_6.6트랜스포머이해하기
_6.7대규모언어모델에대한더깊은이해
_6.8언어모델훈련의도전과제
_6.9GPT-3사용의도전과제
_6.10요약

CHAPTER7대규모언어모델이해하기
_7.1기술적요구사항
_7.2대규모언어모델과기존언어모델의차이
_7.3대규모언어모델이주목받는점
_7.4대규모언어모델을개발하고활용하는이유
_7.5대규모언어모델개발도전과제
_7.6다양한대규모언어모델의유형
_7.7최신대규모언어모델의설계사례
_7.8요약

CHAPTER8대규모언어모델의잠재력을끌어내는RAG활용방법
_8.1기술적요구사항
_8.2대규모언어모델애플리케이션설정:API기반의비공개소스모델
_8.3프롬프트엔지니어링과GPT초기설정
_8.4대규모언어모델애플리케이션설정:로컬오픈소스모델
_8.5허깅페이스의대규모언어모델을파이썬으로활용하기
_8.6RAG와랭체인으로고급시스템설계탐구
_8.7주피터노트북에서간단한랭체인설정검토하기
_8.8클라우드에서의대규모언어모델활용
_8.9요약

CHAPTER9대규모언어모델이주도하는고급응용프로그램및혁신의최전선
_9.1기술요구사항
_9.2RAG및랭체인으로대규모언어모델성능향상:고급기능탐구
_9.3체인을활용한고급방법
_9.4다양한웹소스에서자동으로정보검색하기
_9.5프롬프트압축과API비용절감
_9.6다중에이전트:협력하는대규모언어모델팀구성
_9.7요약

CHAPTER10대규모언어모델과인공지능이주도하는과거,현재,미래트렌드분석
_10.1대규모언어모델과인공지능관련주요기술트렌드
_10.2자연어처리에서컴퓨팅파워의미래
_10.3대규모데이터셋과자연어처리및대규모언어모델에미친영향
_10.4대규모언어모델의진화
_10.5비즈니스세계에서의자연어처리와대규모언어모델
_10.6인공지능과대규모언어모델이유도한행동트렌드(사회적측면)
_10.요약

CHAPTER11세계적전문가들이바라본산업의현재와미래
_11.1전문가소개
_11.2전문가와의인터뷰
_11.3요약

출판사 서평

자연어처리의기초부터고급AI모델설계와비즈니스응용까지
파이썬으로배우는실전자연어처리

이책은자연어처리(NLP)에대해깊이있는내용을다루며,머신러닝의수학적기초부터시작해대규모언어모델(LLM)과인공지능응용프로그램같은고급주제까지포괄적으로설명합니다.학습과정에서머신러닝과자연어처리알고리즘을이해하고구현하는데필수적인선형대수,최적화,확률,통계등의기초개념을체계적으로익히게될것입니다.또한머신러닝의일반적인기술을배우고이를자연어처리와어떻게접목할수있는지도알아봅니다.
이제막대규모언어모델로자연어처리에관심이생긴분들에게는이거대한흐름의주요키워드를이해하는데도움이될것이며,이미익숙한분들에게는전반적인내용을정리하고전망을살펴볼기회를제공할것입니다.

주요내용
머신러닝과NLP의수학적기초를익히는법
텍스트데이터를전처리하고분석하는고급기법
파이썬으로머신러닝-NLP시스템을설계하는방법
전통적인머신러닝및딥러닝방법으로텍스트를모델링하고분류하는법
LLM의이론과설계를이해하고이를다양한AI응용분야에구현하는방법
NLP의통찰과동향,그리고미래동향과잠재력을탐구하는방법

대상독자
딥러닝,머신러닝연구자,NLP실무자,ML/NLP교육자,텍스트데이터를사용하는전문가
파이썬초보자,머신러닝에관심있는이공계대학생