파이썬 자연어 처리의 이론과 실제 (효율적인 자연어 처리를 위한 머신 러닝과 딥러닝 구현하기)

파이썬 자연어 처리의 이론과 실제 (효율적인 자연어 처리를 위한 머신 러닝과 딥러닝 구현하기)

$36.28
Description
자연어 처리는 복잡한 영역이라 아주 많은 자료가 존재한다. 학습자가 자연어 처리를 익히려면 여기저기 발품을 팔아야 하는 실정이다. 저자는 이와 같은 현실을 깨닫고 한 권의 책으로 파이썬 자연어 처리의 전반을 이해할 수 있게 집필했다. 이 책은 자연어 처리 기초부터 머신 러닝, 딥러닝에 이르기까지 안내서이자 참고서의 역할을 톡톡히 해낼 것이다.
저자

잘라지트하나키

저자잘라지트하나키는데이터과학자다.구체적으로말하면데이터과학연구자다.데이터과학관련문제를다루는것을좋아한다.또한데이터과학과인공지능관련기술을사용해세계를더나은곳으로만들고싶어한다.연구관심사는자연어처리,머신러닝,딥러닝및대용량데이터분석이다.사회활동가,여행자,자연애호가이기도하다.

목차

머리말
지은이소개
감사의글
기술감수자소개
옮긴이소개
옮긴이의말
들어가며

1장.소개
__자연어처리에대한이해
__기본애플리케이션이해
__공생의이점:NLP와파이썬
__NLTK환경설정
__독자를위한팁

2장.코퍼스와데이터세트의실제이해
__코퍼스란무엇인가?
__왜코퍼스가필요한가?
__코퍼스분석이해
__데이터속성타입이해
__코포라의여러파일형식알아보기
__무료코포라접근용자원
__NLP애플리케이션용데이터세트준비
__웹스크레이핑
__요약

3장.문장구조의이해
__NLP의컴포넌트이해
__자연어이해
__문맥자유문법정의
__형태학적분석
__구문분석
__의미분석
__모호성처리
__담화통합
__화용분석
__요약

4장.전처리
__코퍼스-원시텍스트처리
__코퍼스-원시문장처리
__기본전처리
__실제적이고사용자정의된전처리
__요약

5장.피처엔지니어링과NLP알고리즘
__피처엔지니어링이해
__NLP의기본피처
__NLP에대한기본통계피처
__피처엔지니어링의이점
__피처엔지니어링의과제
__요약

6장.고급피처엔지니어링과NLP알고리즘
__워드임베딩에대한기억
__word2vec의기본사항이해
__word2vec모델을블랙박스에서화이트박스로변환하기
__word2vec모델의컴포넌트이해하기
__word2vec모델의로직이해하기
__word2vec모델의알고리즘기술과수학이해하기
__word2vec에관련된사실
__word2vec애플리케이션
__간단한예제구현
__word2vec의이점
__word2vec의문제
__실제애플리케이션에서word2vec은어떻게사용되는가?
__word2vec는언제사용해야하는가?
__흥미로운모델개발하기
__word2vec개념의확장
__딥러닝에서벡터화의중요성
__요약

7장.NLP를위한규칙기반시스템
__규칙기반시스템에대한이해
__규칙기반시스템장착의목적
__RB시스템의아키텍처
__RB시스템개발라이프사이클에대한이해
__애플리케이션
__RB시스템을사용해NLP애플리케이션개발
__규칙기반접근법과다른접근법비교
__규칙기반시스템의장점
__규칙기반시스템의단점
__규칙기반시스템에대한과제
__단어의미의모호성기본에대한이해
__규칙기반시스템의최근동향에대한논의
__요약

8장.NLP문제에대한머신러닝
__머신러닝의기본에대한이해
__NLP애플리케이션개발단계
__ML알고리즘과기타개념이해
__NLP애플리케이션을위한하이브리드접근법
__요약

9장.NLU과NLG문제에대한딥러닝
__인공지능개요
__NLU와NLG비교
__딥러닝에대한간략한개요
__신경망의기본지식
__ANN구현
__딥러닝과심층신경망
__딥러닝기술과NLG
__경사하강법기반의최적화
__인공지능대인간지능
__요약

부록A.고급도구
__저장소프레임워크로서의아파치하둡
__프로세싱프레임워크로서의아파치스파크
__실시간프로세싱프레임워크로서의아파치플링크
__파이썬의시각화라이브러리
__요약

부록B.NLP기술을향상시키는방법
__NLP로새로운경력쌓기
__치트시트
__자신의영역선택
__성공을달성하기위한일의민첩한방식
__NLP와데이터과학에대해유용한블로그
__공개데이터세트얻기
__데이터과학에필요한수학
__요약

부록C.설치안내
__파이썬,pip,NLTK설치
__PyCharmIDE설치하기
__종속성설치
__프레임설치가이드
__질문
__요약

출판사 서평

★이책에서다루는내용★
■NLP애플리케이션을개발하는데사용되는파이썬프로그래밍패러다임
■코퍼스분석과다양한타입의데이터속성이해
■NLTK,Polyglot,SpaCy,스탠포드CoreNLP등의파이썬라이브러리를사용한NLP학습
■피처엔지니어링의일부로피처추출과피처선택
■딥러닝에서벡터화의장점
■규칙기반시스템의아키텍처
■NLP문제에대한지도및비지도머신러닝알고리즘최적화와튜닝
■자연어처리와자연어생성문제에대한심층학습기술

★이책의대상독자★
NLP를구현해서더스마트한애플리케이션을만들려는파이썬개발자를위한책이다.

★이책의구성★
1장,‘소개’에서는NLP와NLP분야에관련된여러갈래를소개한다.NLP애플리케이션빌드와NLTK설치를논의하는다양한단계를알아본다.
2장,‘코퍼스와데이터세트의실제이해’에서는코퍼스분석의모든측면을보여준다.코퍼스에존재하는다양한타입의코퍼스와데이터속성을볼수있다.CSV,JSON,XML,LibSVM등과같은각코퍼스형식을다루며,웹스크레이핑예제도살펴본다.
3장,‘문장구조의이해’에서는언어학인자연어의가장기본적인측면을이해해본다.어휘분석,구문분석,의미분석,모호성처리등의개념을설명한다.모든개념을실질적으로이해하는데는NLTK를사용한다.
4장,‘전처리’에서는다양한타입의전처리기술과이를사용자정의할수있는방법을알아본다.데이터준비,데이터처리,데이터변환같은전처리단계를살펴본다.이외에도전처리의실제적인측면을이해한다.
5장,‘피처엔지니어링과NLP알고리즘’에서는NLP애플리케이션의핵심부분을본다.NLP애플리케이션을개발할때사용하는머신러닝알고리즘에대한입력생성을위해서로다른알고리즘과도구가어떻게사용되는지살펴본다.피처엔지니어링에서사용되는통계적개념을이해하게되며,도구와알고리즘의사용자정의로넘어갈것이다.
6장,‘고급피처엔지니어링과NLP알고리즘’에서는의미론적문제를다루는데사용되는NLP의최신개념을이해한다.「왕좌의게임(GameofThrones)」데이터세트에서벡터를생성해word2vec,doc2vec,GloVe등을알아볼수있을뿐아니라word2vec의실제구현도볼수있다.
7장,‘NLP를위한규칙기반시스템’에서는규칙기반시스템을구축하는방법과NLP용으로동일한시스템을개발하는동안명심해야할모든측면을자세히설명한다.규칙제작과정을보며규칙도직접코딩해본다.또한템플릿기반의챗봇(chatbot)을어떻게개발하는지살펴본다.
8장,‘NLP문제에대한머신러닝’에서는머신러닝기술의새로운면을알아본다.NLP애플리케이션을개발하는데사용되는다양한알고리즘을볼수있다.또한머신러닝을사용해멋진NLP애플리케이션도구현해본다.
9장,‘NLU와NLG문제에대한딥러닝’에서는인공지능의다양한측면을소개한다.인공신경망(ANN)의기본개념과자신만의ANN을만드는방법을살펴본다.하드코어딥러닝을이해하고딥러닝의수학적측면을개발하며,자연어이해(NLU)와자연어생성(NLG)에딥러닝이얼마나사용되는지확인한다.여기서도멋진실전예제를기대할수있다.
부록A,‘고급도구’에서는아파치하둡,아파치스파크,아파치플링크같은다양한프레임워크를간략하게소개한다.
부록B,‘NLP기술을향상시키는방법’에서는NLP기술을최신상태로유지하는방법을설명하며,지속적인학습이새로운NLP기술을습득하는데얼마나도움이되는지의견을제시한다.
부록C,‘설치안내’에서는필요한설치에대한지시사항을볼수있다.

[역자의말추가]
자연어처리는인공지능과맞물려현대생활의중심으로들어오고있다.광고에는사람의말을알아듣는제품이등장하고,시중에는말로제어하는가전기기가출시돼있다.인간형로봇의경우에는인간과의사소통을하기위해자연어처리가필수다.이제컴퓨터관련분야에종사하거나관심있는사람들이자연어처리를알아야만하는상황이된것이다.
하지만자연어처리는복잡한영역이라아주많은자료가존재하며,학습자가자연어처리를익히려면여기저기발품을팔아야하는실정이다.저자는그런현실을깨닫고한권의책으로파이썬자연어처리의전반을이해할수있도록집필했다.
한정된지면에많은지식을넣기위해저자는링크를활용했다.안내서로의역할도충분해서독자가해당링크를방문해학습한다면이책한권으로여러권분량의지식을쌓는성과를얻을수있다.생소하게느낄수도있는전문용어에는주석을달아손쉽게관련용어를이해할수있게했다.이책에서익힌지식을한국어자연어처리에잘응용할수있기를바란다.