인공지능 기반 자연어 처리

인공지능 기반 자연어 처리

$41.41
Description
자연어 처리(NLP: Natural Language Processing)는 앞으로 인공지능(AI)이 인간의 언어와 행동을 이해하는 방식에 영향을 주는 방향으로 발전해 갈 것이며, 이 자연어 처리의 비약적인 발전에는 딥러닝이 핵심 역할을 하고 있다. 언어란 고도로 구체적이고 단어 자체의 의미 외에도 문맥이라는 상황 정의 안에서 작동한다. 즉, 특정 언어를 사용한 창작자와 그 언어를 소비한 독자는 어휘, 단어의 선택, 구문, 철자 및 구두법에서 서로 다른 의미로 이해하고 해석할 수 있다. 언어는 시간이 지나면서 진화하고, 격식을 갖춘 문서에서 쓰는 언어와 온라인에서 사용하는 언어가 다르기 때문에 확장성이 떨어진다. NLP 영역에서의 이런 문제를 인공지능 기술이 해결할 수 있다. 인공지능을 통해 단어나 구문이 문단 내에서 어떻게 사용되고 있는지 직접 관찰하는 방식으로 그 의미를 학습할 수 있다. 그 결과, 미리 확인된 문맥을 입력하거나 사람이 개입하여 의미를 밝히고 관계를 정의하는 대신, 인공지능이 단어 또는 구문의 의미와 관계를 원문을 통해서 바로 학습할 수 있게 됐다.
이처럼 NLP를 통해 누릴 수 있는 이점이 많은 것은 분명하지만, 아직 보완해야 할 부분도 있다. 특히 설명 생성과 같은 기능이 미흡하다고 할 수 있다. 그럼에도 불구하고 향후 개발될 딥러닝 기반 NLP는 인간의 개입을 점점 덜 필요한 방향으로 개선될 것으로 예측된다.
본 책은 빠르게 발전하는 자연어 처리 기술들에 대한 기본적인 원리를 설명하고 파이썬 코드로 구현된 예제들을 통해 현실의 문제에 직접 적용할 수 있도록 설계되었다. 최근까지 한국어 자연어 처리 기법은 활발히 연구되어오지 못했었다. 아마, 한국어는 교착어가 가진 독특함 때문에 어간에 접사가 붙어 단어의 의미와 문법적 기능이 구체화되고, 어순의 중요성이 상대적으로 낮은 특징을 가지고 있기 때문에 영어와 같은 고립어에 비해 한국어 자연어 처리 기법 개발이 더 어려웠을 것이라고 스스로 위안을 가져본다. 다행히도 인공지능 시대에 언어 모델에 대한 관심이 많아졌고 다양한 한국어 자연어 처리 기법들이 개발되고 있다. 바라건대, 저자는 본 책이 이런 시대적 요구에 부응하고 한국어 자연어 처리 생태계의 발전에 이바지할 수 있다면 더할 나위 없이 기쁠 것이다.
저자

송민

저자송민교수는연세대문헌정보학과정교수이고2017년을제외한2014년부터2023년8월까지언더우드특훈교수를2회역임하였다.송민교수는연세대학교문헌정보학학사,IndianaUniversity문헌정보학석사,DrexelUniversity의SchoolofInformationScienceandTechnology에서박사학위를마쳤다.연세대학교로부임하기전에는필라델피아에있는ThomsonReuters사에SeniorSoftwareEngineer로1999년부터2005년까지근무했으며,그후2006년부터2012년2월까지뉴저지공대(NewJerseyInstituteofTechnology)에서정보시스템학과에부교수로근무했다.
전공분야는TextMining을비롯해KnowledgeGraph,BiomedicalLiteratureMining이며지금까지SCI급논문111여편과국제학술지130여편을게재하였다.연구재단이주관하는SocialScienceinKorea(SSK)대형책임연구자를2018년부터2022년까지수행하였으며BK21+인공지능구축을위한지식정보전문가양성교육연구팀의책임연구자이다.또한,중견연구자지원사업(미발견생의학지식추론을위한멀티모달리티뉴럴서치시스템개발및지식베이스구축)과우수학자지원사업(계량개체학기반다학제적지식융복합연구)의책임연구자로연구를수행하고있다.

목차

Chapter01서론
1.MicrosoftVisualStudio설치
2.파이썬설치
3.파이참설치

Chapter02텍스트표상모듈
1.텍스트전처리개요
2.텍스트전처리기법

Chapter03나무구조
1.구문분석개요
2.구문분석기
3.한국어구문분석

Chapter04핵심어추출
1.핵심어추출개요
2.비지도학습핵심어추출기법
3.지도학습핵심어추출기법

Chapter05동시출현단어(co-word)분석
1.동시출현단어분석개요
2.동시출현단어계산법
3.Gephi이용가이드

Chapter06클러스터링
1.벡터공간모델
2.유사도계산방법론
3.군집분석방법:K-Means

Chapter07토픽모델링
1.토픽모델링개요
2.토픽모델링기법

Chapter08자동분류
1.문헌분류개요
2.지니계수와엔트로피
3.문헌분류방법론

Chapter09감성분석
1.감성분석개요
2.감성분석방법론

Chapter10워드임베딩
1.워드임베딩개요
2.위드임베딩방법론

Chapter11문헌임베딩
1.문헌임베딩개요
2.Doc2Vec
3.Node2Vec

Chapter12Transformer
1.Seq2seqRNN모델개요
2.어텐션(attention)
3.BERT

Chapter13NER(개체명인식)
1.InformationExtraction
2.NER개요
3.NER방법론

Chapter14기계번역
1.기계번역개요
2.시퀀스(sequence)기반방법론
3.어텐션(attention)기반방법론

Chapter15QuestionAnswering
1.QuestionAnswering개요
2.정보검색기반방법론
3.딥러닝기반방법론

Chapter16ConversationalAI
1.ConversationalAI개요
2.ConversationAI방법론