트랜스포머로 시작하는 언어 모델과 생성형 인공지능 (100개의 그림 예제로 이해하기)

트랜스포머로 시작하는 언어 모델과 생성형 인공지능 (100개의 그림 예제로 이해하기)

$18.27
Description
ㆍ트랜스포머로 시작하는 사전 학습 언어 모델, 거대 언어 모델, 소형 거대 언어 모델을 분석!
ㆍChatGPT 이후 급격하게 변화된 인공지능 기술을 상세히 분석!
ㆍOpenAI와 대결하는 거대 테크 기업간의 다양한 언어 모델을 분석!
이 책은 트랜스포머의 기본 원리부터 이를 기반으로 한 언어 모델의 발전 과정과 생성형 인공지능의 시대까지 그 흐름을 쉽고 체계적으로 설명합니다. 특히, 인공지능의 핵심적 원리와 기술을 단순히 나열하는 것이 아니라 시대별로 구분된 100개의 주제와 그림을 통해 직관적으로 이해할 수 있도록 구성하였습니다. 복잡한 수식이나 알고리즘 때문에 인공지능 학습에 두려움을 느꼈던 독자라면 이번 도서가 한 걸음 더 나아갈 수 있는 디딤돌이 될 것입니다.
저자

추형석

▶저자추형석(신구대학교AI소프트웨어학과교수)
[경력]
ㆍ국가수리과학연구소박사후연구원(2013~2015)
ㆍ소프트웨어정책연구소선임연구원(2015~2023)

[주요업적]
ㆍ서울신문IT신트렌드정기기고(2016~2019)
ㆍ정보통신기획평가원인공지능분야R&D과제기획위원(2019)
ㆍ행정안전부정부혁신컨설팅단위원(2020,2021)

[주요업무]
ㆍ인공지능분야의최신기술동향을분석
ㆍ인공지능R&D기획,인공지능인재양성,인공지능컴퓨팅인프라구축등인공지능관련정책연구

목차

제1장인공지능의혁신트랜스포머
01트랜스포머가바꾼인공지능
02트랜스포머의개념적이해
03언어모델의이해
04언어모델과데이터
05언어모델구현방법의변화
06사전학습언어모델
07거대언어모델
08기반모델과생성형인공지능

제2장트랜스포머의구조와분석
01딥러닝과트랜스포머
02인공지능모델의트랜스포머
03트랜스포머의구조
04트랜스포머의입력-토큰화
05트랜스포머의입력-토큰간관계설정
06원핫인코딩과토큰임베딩(CBOW)
07토큰임베딩과토큰임베딩차원
08위치인코딩-토큰의위치와접근법
09위치인코딩-토큰임베딩벡터
10트랜스포머의인코더
11멀티헤드어텐션의입력과쿼리
12멀티헤드어텐션의키와점곱어텐션
13멀티헤드어텐션의가치와어텐션헤드
14정규화와앞먹임신경망
15셀프어텐션
16인코더의반복과초모수
17트랜스포머의디코더
18트랜스포머의인코더와디코더결합
19트랜스포머의출력

제3장사전학습언어모델
01사전학습언어모델의개요
02사전학습언어모델의접근방법
03다양한자연어처리과업
04전형적인자연어처리과업
05BERT의구조와특징
06OpenAI의GPT구조
07GPT-2의개념과구조
08RoBERTa의성능과구조
09ALBERT의접근과구조
10DistilBERT의접근과성능
11MobileBERT의개념과특징
12SpanBERT의개념과특징
13ELECTRA의개념과활용
14DeBERTa의개념과기능
15TransformerXL의등장과성능
16XLNet의개념과성능
17BART의개념과특징
18CTRL의개념과특징
19T5의구조와성능
20HuggingFace와Transformers

제4장거대언어모델
01거대언어모델의개요
02거대언어모델의규모
03거대언어모델의구조
04거대언어모델의특징과재학습방법
05거대언어모델의한계
06계산적관점에서의딥러닝
07행렬곱연산
08거대언어모델의계산량과효과
09거대언어모델의활용
10GPT-3의구조와성능
11LaMDA의구조와특징
12MTNLG의개념과성능
13Gopher의등장과접근법
14InstructGPT의접근법과특징
15PanGu알파의배경과특징
16PaLM의개념과특징
17OPT175B의시작과특징
18BLOOM의배경과특징
19HyperCLOVA의개념과특징
20규모경쟁과ChatGPT의등장

제5장ChatGPT와생성인공지능
01ChatGPT의성공과변화
02ChatGPT의효과와계산량
03ChatGPT이후의인공지능
04환각효과완화의기본적접근
05설명가능한인공지능과거대언어모델
06모델경량화의기본적접근
07모델경량화와하드웨어
08트랜스포머의기본적접근
09RWKV의개념과구조
10RetentiveNetwork의접근과특징
11거대테크기업의움직임
12GPT-4의배경과특징
13GPT-4Turbo와GPT-4o의특징
14GPT-o1과GPT-5의특징
15OpenAI의GPT스토어
16Bard의특징과기능
17PaLM2의규모와특징
18Gemini의등장과특징
19Copilot의등장과특징
20Claude의개발과특징
21소규모거대언어모델의등장
22LLaMA의특징과구조
23LLaMA2와LLaMA3의성능
24Gemma의특징과기능
25MistralAI의등장과특징
26phi의특징과기능
27한국의sLLM과Solar
28대화형인공지능과sLLM활용도구
29인공지능의기술적미래전망
30인공지능의플랫폼미래전망
31인공지능의규제전망
32인공지능의정책전망
33범용인공지능의미래전망

출판사 서평

이책은단순히트랜스포머를설명하는데그치지않습니다.트랜스포머의등장이후인공지능은생성형AI라는새로운시대를맞이하게되었고,플랫폼과오픈소스를통해개발의진입장벽이현저하게낮아지고있습니다.특히,생성형AI를언어모델의관점에서집중적으로분석하여글로벌빅테크기업의경쟁구도를설명합니다.또한,누구나쉽게노트북에서도실행해볼수있는사전학습언어모델과sLLM실습도영상으로담아실제인공지능을활용해볼수있는기회도제공합니다.이책이트랜스포머와생성형인공지능의세계를탐구하고자하는학생,연구자,실무자모두에게의미있는지침서가되기를바랍니다.AI기술의발전속도는놀라울정도로빠릅니다.하지만그혁신의중심에는언제나트랜스포머가있었고,앞으로도있을것으로전망합니다.