파이썬 텍스트 마이닝 바이블 2 (파이썬 기초부터 트랜스포머, BERT, GPT까지 | 심층 이론과 실습으로 배우는 텍스트 마이닝의 모든 것)

파이썬 텍스트 마이닝 바이블 2 (파이썬 기초부터 트랜스포머, BERT, GPT까지 | 심층 이론과 실습으로 배우는 텍스트 마이닝의 모든 것)

$30.51
Description
기계학습과 딥러닝 알고리즘, 텍스트 분석을 이 책 한 권으로 끝내자!
기계학습과 딥러닝 알고리즘을 이용해서 텍스트 분석을 잘하기 위해서는 알고리즘의 작동원리를 정확히 이해하는 것이 중요합니다. 이 책은 텍스트 분석 실습뿐 아니라, 텍스트 분석에서 중요한 역할을 하는 기계학습과 딥러닝 알고리즘의 작동 원리를 자세히 설명합니다. 알고리즘의 이해를 돕기 위해, 알고리즘을 이해하는 데 필요한 수학 개념(벡터, 행렬, 확률 등)에 관한 설명도 제공합니다.

텍스트 분석이나 코딩 경험이 없는 독자도 쉽게 접할 수 있도록, 파이썬 기초와 텍스트 분석의 기초, 텍스트 분석을 하는 데 필요한 기본적인 내용(웹스크레이핑, 정규표현식 등)에 관해서도 부록에서 다룹니다.
저자

이상엽

연세대학교언론홍보영상학부부교수이며연세대학교인공지능대학의겸임교수로활동하고있다.파이썬코딩,빅데이터통계분석,기계학습,딥러닝,텍스트마이닝등의수업을진행하며,컴퓨테이셔널미디어랩을운영하면서사회현상과관련된온라인비정형데이터를통계방법과기계학습ㆍ딥러닝알고리즘을이용해분석하는연구를수행하고있다.연세대학교에서컴퓨터과학을공부했고,미시간주립대에서미디어ㆍ정보전공으로석사와박사학위를받았다.

목차

[3부]딥러닝을이용한텍스트분석

▣13장:딥러닝소개
13.1신경망
___13.1.1신경망소개
___13.1.2신경망의작동원리
13.2활성화함수
___13.2.1시그모이드함수
___13.2.2하이퍼볼릭탄젠트함수
___13.2.3ReLU함수
___13.2.4LeakyReLU함수
___13.2.5ELU함수
___13.2.6소프트플러스함수
___13.2.7GELU함수
13.3경사하강법
___13.3.1사용되는관측치의수에따른경사하강법구분
___13.3.2신경망에서의경사하강법작동원리
___13.3.3오차역전파
___13.3.4경사소실문제
___13.3.5경사폭발문제
___13.3.6옵티마이저의종류
___13.3.7가중치감쇠와학습률감쇠
13.4가중치초기화
___13.4.1Xavier초기화방법
___13.4.2He초기화방법
13.5예제:도시의평균집값예측하기
___13.5.1SGD옵티마이저의사용예
___13.5.2RMSprop옵티마이저사용의예
___13.5.3Adam옵티마이저의사용예
13.6신경망에서의과적합해결방법
___13.6.1L1/L2규제화
___13.6.2드롭아웃
___13.6.3조기종료
___13.6.4배치정규화
___13.6.5계층정규화

▣14장:FNN을이용한텍스트분석과단어및문서임베딩
14.1FNN을이용한텍스트분석
14.2단어임베딩
___14.2.1원-핫벡터와단어임베딩
___14.2.2Word2vec
___14.2.3FastText
14.3문서임베딩
___14.3.1Doc2vec

▣15장:CNN을이용한텍스트분석
15.1CNN
___15.1.1CNN소개
___15.1.2파이썬코딩하기
15.2CNN을이용한텍스트분석
___15.2.1CNN에서의문서표현
___15.2.2파이썬코딩하기

▣16장:순환신경망기반알고리즘을이용한텍스트분석
16.1RNN
___16.1.1RNN소개
___16.1.2RNN을이용한감성분석
___16.1.3각단어의은닉상태벡터를모두사용하기
___16.1.4여러개의RNN층사용하기
16.2LSTM
___16.2.1LSTM소개
___16.2.2LSTM을이용한감성분석
___16.2.3양방향LSTM
___16.2.4양방향LSTM을사용한감성분석
16.3seq2seq

▣17장:트랜스포머
17.1어텐션알고리즘
17.2셀프어텐션
17.3트랜스포머에서의어텐션
17.4트랜스포머소개
___17.4.1트랜스포머의구조
___17.4.2인코더부분
___17.4.3디코더부분
___17.4.4트랜스포머의인코더블록을이용한감성분석

▣18장:BERT
18.1BERT의구조
___18.1.1BERT내부구조
___18.1.2BERT학습
___18.1.3BERT논문에서사용된다운스트림작업
___18.1.4BERT를이용한각단어의벡터추출하기
18.2파이썬코딩하기
___18.2.1BERT를사용한단어와문장/문서의벡터추출하기
___18.2.2영어텍스트감성분석
___18.2.3한글텍스트감성분석

▣19장:BERT기반방법들
19.1ALBERT
___19.1.1ALBERT소개
___19.1.2파이썬코딩하기
19.2RoBERTa
___19.2.1RoBERTa소개
___19.2.2파이썬코딩하기
19.3ELECTRA
___19.3.1ELECTRA소개
___19.3.2파이썬코딩하기
19.4지식증류기반방법들
___19.4.1지식증류
___19.4.2DistilBERT
___19.4.3TinyBERT
19.5BERTopic
___19.5.1문서임베딩
___19.5.2문서군집화
___19.5.3각군집(토픽)을나타내는단어찾기
___19.5.4파이썬코딩하기

▣20장:GPT모형들
20.1GPT-1
___20.1.1GPT-1에서의학습
20.2GPT-2
___20.2.1학습데이터
___20.2.2모형의구조
___20.2.3모형의성능
___20.2.4파이썬코딩하기
20.3GPT-3
___20.3.1제로샷,원샷,퓨샷
___20.3.2학습데이터
___20.3.3모형의구조
___20.3.4모형의성능
___20.3.5GPT-3미세조정하기
20.4InstructGPT
___20.4.1InstructGPT에서의미세조정
___20.4.2모형의성능
20.5ChatGPT

▣21장:비전트랜스포머를이용한텍스트분석
21.1ViT소개
21.2ViT를이용한이미지분류
21.3ViT를이용한텍스트분류
___21.3.1방법1:N×D문서에서직접패치를추출
___21.3.2방법2:문서를패치로분할하기전에Conv1D필터적용하기
___21.3.3방법3:N×C결과물에서C×C패치추출하기

▣22장:오토인코더를이용한텍스트분석
22.1오토인코더소개
22.2오토인코더를MNIST데이터에적용해보기
22.3오토인코더를이용해문서를저차원벡터로표현하기
___22.3.1LSTM기반오토인코더사용해보기
___22.3.2CNN기반오토인코더사용해보기

▣부록A:경사하강법에서의순전파와역전파
A.1예제신경망모형
A.2순전파
A.3역전파

출판사 서평

★이책에서다루는내용★

◎파이썬기초,웹스크레이핑,정규표현식
◎기본수학:선형대수,확률,MLE,EM알고리즘,베이지안추론등
◎텍스트전처리와텍스트네트워크분석
◎기계학습알고리즘을활용한텍스트분석:K-평균,위계적군집분석,DBSCAN,GMM,차원◎축소,로지스틱회귀모형,나이브베이즈,결정트리,앙상블알고리즘,SVM,토픽모델링
◎딥러닝알고리즘을활용한텍스트분석:FNN,CNN,RNN,LSTM,GRU,seq2seq,Transformer,BERT와BERT기반알고리즘,GPT모형,비전트랜스포머,오토인코더