음성과 언어 처리 (기계는 어떻게 사람의 말을 이해할까? | 2 판)

음성과 언어 처리 (기계는 어떻게 사람의 말을 이해할까? | 2 판)

$79.11
Description
이 책은 단어와 구성 요소들로 시작해서, 단어의 시퀀스 속성과 단어들이 어떻게 말하고 이해되는지를 다룬다. 그리고 언어 간 질의 응답, 대화, 번역의 기초가 되는 단어들이 서로 어울리는 방식(구문론), 의미를 형성하는 방식(의미론)을 설명한다. 또한 기술의 관점에서 정규 표현, 정보 검색, 문맥 자유 문법, 통일, 일차 술어 해석, 은닉 마르코프와 다른 확률론적 모델, 수사학적 구조 이론 등을 다루고 있다. 이 책을 따라 가면 음성 및 언어 처리의 핵심적인 알고리듬을 거의 다 경험해 볼 수 있다.

언어학은 과학 분야에서 100년의 역사를 가지고 있고, 컴퓨터 언어학은 컴퓨터 공학의 일부로서 50년의 역사를 가지고 있다. 그러나 언어 이해 기술이 인터넷에서 정보 검색과 기계 번역을 이용할 수 있고, 데스크톱 컴퓨터에서 음성 인식이 인기를 끌면서 수백만 명에게 알려진 산업으로 부상한 것은 불과 10여 년 전의 일이다. 이 산업은 언어 정보의 표현과 처리의 이론적 진보에 의해 가능해졌다.
『음성과 언어 처리 2/e』은 모든 수준에서 모든 현대 기술과 함께 철저히 다루는 최초의 책이다. 심층 언어 분석과 견고한 통계 방법을 결합하며, 레벨의 관점에서 보면 단어와 그 구성 요소들로 시작해 단어의 시퀀스 속성과 단어들이 어떻게 말하고 이해되는지 다룬 뒤, 단어들이 서로 어울리는 방식(구문), 의미를 형성하는 방식(의미론), 언어 간 질의응답, 대화, 번역의 기초를 살펴본다. 기술의 관점에서 보면 정규 표현, 정보 검색, 문맥 자유 문법, 통일, 일차 술어 해석, 은닉 마르코프와 다른 확률론적 모델, 수사학적 구조 이론 등을 다루고 있다. 이전에는 이런 종류의 적용 범위를 얻으려면 두세 권의 책이 필요했을 것이다. 이 책은 한 권으로 이 모든 범위를 다루고 있다. 하지만 무엇보다 각각의 기술이 어떻게 가장 잘 사용되고, 어떻게 함께 사용될 수 있는지에 대한 감각을 제공하고 있다는 점이 더 중요하다. 독자의 관심을 유지하고 철저하지만 무미건조하지 않은 방식으로 기술적 세부 사항에 동기를 부여하는 매력적인 스타일로 이 모든 과정을 수행한다. 여러분이 과학적이거나 산업적인 관점에서 본 분야에 관심이 있든지 간에 이 책은 이 매혹적인 분야의 향후 연구에 이상적인 소개와 안내 역할을 해줄 수 있을 것이다.
2000년에 출간된 이 책의 초판 이후 음성 및 언어 처리 분야는 여러 면에서 발전했다. 널리 사용되는 언어 기술에는 더 많은 애플리케이션이 있다. 많은 언어 데이터 모음(쓰기 및 말하기)을 사용할 수 있게 되면서, 통계 머신러닝에 훨씬 더 의존하게 됐다. 이 개정판은 이론과 실제 관점에서 새로운 혁신을 다루며, 학습할 부분을 더 쉽게 선택할 수 있게 해준다(부와 장 간의 종속성이 더 적다).
언어 처리 분야는 초판이 출간된 이후에도 몇 가지 뛰어난 설명문이 있었지만, 이 책은 어떤 책보다도 언어 처리 분야 전반을 가장 훌륭히 설명하고 있다.

◈ 이 책의 대상 독자 ◈
주로 대학원이나 고급 학부 과정에 사용하기 위한 것이다. 포괄적인 적용 범위와 알고리듬의 수가 많기 때문에 음성 및 언어 처리 분야의 학생과 전문가들에게 참고 자료로 유용하다.
저자

댄주라프스키,제임스H.마틴

DanJurafsky
미국스탠퍼드대학교컴퓨터공학과와언어학부부교수다.볼더의콜로라도대학교언어학및컴퓨터공학과와인지과학연구소에서교수로도근무했다.미국뉴욕용커스에서태어나버클리에있는캘리포니아대학교에서1983년언어학학사학위와1992년컴퓨터공학박사학위를받았다.
1998년에국립과학재단커리어(CAREER)상을,2002년맥아더펠로우십(MacArthurFellowship)상을받았다.음성과언어처리의광범위한주제에관한90여편의논문을발표했다.

목차

1장.소개
1.1음성및언어처리에관한지식
1.2중의성
1.3모델과알고리듬
1.4언어,생각및이해
1.5현재의기술수준
1.6일부간략한역사
1.6.1기초적이해:1940년대와1950년대
1.6.2두캠프:1957~1970년
1.6.3네가지패러다임:1970~1983년
1.6.4경험론및유한상태모델리덕스:1983~1993년
1.6.5필드통합:1994~1999년
1.6.6머신러닝의증가:2000~2008년
1.6.7복수발견
1.6.8심리학에대한간단한요약
1.7요약
참고문헌및역사참고사항

2장.정규표현식과오토마타
2.1정규표현식
2.1.1기본정규표현식패턴
2.1.2분리,그룹화및우선순위
2.1.3간단한예
2.1.4더복잡한예
2.1.5고급연산자
2.1.6정규표현식치환,메모리및엘리자
2.2유한상태오토마타
2.2.1양의울음소리를인식하기위한FSA의사용
2.2.2형식언어
2.2.3또다른예
2.2.4비결정적FSA
2.2.5문자열수용을위한NFSA사용
2.2.6검색으로인식
2.2.7결정적및비결정적오토마타의관계
2.3정규언어및FSA
2.4요약
참고문헌및역사참고사항
연습

3장.단어및변환기
3.1(대부분의)영어형태론조사
3.1.1굴절형태론
3.1.2파생형태론
3.1.3접어화
3.1.4비연결형형태론
3.1.5일치
3.2유한상태형태론파싱
3.3유한상태어휘목록의구조
3.4유한상태변환기
3.4.1순차변환기및결정론
3.5형태론적파싱에대한FST
3.6변환기및철자규칙
3.7FST어휘와규칙의조합
3.8어휘목록이없는FST:포터어간
3.9단어및문장토큰화
3.9.1중국어분할
3.10철자오류감지및수정
3.11최소편집거리
3.12인간의형태론적처리
3.13요약
참고문헌및역사참고사항
연습

4장.N그램
4.1코퍼스에서의단어세기
4.2단순(Unsmoothed)N그램
4.3훈련및테스트세트
4.3.1훈련코퍼스에대한N그램민감도
4.3.2미등록어:개방형대폐쇄형어휘과제
4.4N그램평가:복잡도
4.5평탄화
4.5.1라플라스평탄화
4.5.2굿튜링할인
4.5.3굿튜링추정의일부고급문제
4.6보정법
4.7백오프
4.7.1고급:캐츠백오프α및P⁎계산세부사항
4.8실제문제:툴킷및데이터형식
4.9언어모델링의고급문제
4.9.1고급평탄화방법:Kneser-Ney평탄화
4.9.2부류기반N그램
4.9.3언어모델적응및웹사용
4.9.4장거리정보사용:간단한요약
4.10고급:정보이론배경
4.10.1모델비교를위한교차엔트로피
4.11고급:영어의엔트로피와엔트로피비율의불변성
4.12요약
참고문헌및역사참고사항
연습

5장.품사태깅
5.1(대부분)영어의어휘범주
5.2영어태그세트
5.3품사태깅
5.4규칙기반품사태깅
5.5HMM품사태깅
5.5.1가장가능성이높은태그시퀀스계산:예
5.5.2은닉마르코프모델태거공식화
5.5.3HMM태깅을위한비터비알고리듬사용
5.5.4HMM알고리듬을트라이그램으로확장
5.6변환기반태깅
5.6.1TBL규칙적용방법
5.6.2TBL규칙학습방법
5.7평가및오류분석
5.7.1오류분석
5.8품사태깅의고급문제
5.8.1실제문제:태그불확실성및토큰화
5.8.2미지의단어
5.8.3다른언어의품사태깅
5.8.4태거조합
5.9고급:철자를위한잡음통신로모델
5.9.1맥락별철자오류수정
5.10요약
참고문헌및역사참고사항
연습

6장.은닉마르코프및최대엔트로피모델
6.1마르코프연쇄
6.2은닉마르코프모델
6.3우도계산:순방향알고리듬
6.4디코딩:비터비알고리듬
6.5HMM훈련:순방향-역방향알고리듬
6.6최대엔트로피모델:배경
6.6.1선형회귀분석
6.6.2로지스틱회귀
6.6.3로지스틱회귀:분류
6.6.4고급:로지스틱회귀학습
6.7최대엔트로피모델링
6.7.1최대엔트로피라고부르는이유
6.8최대엔트로피마르코프모델
6.8.1MEMM에서디코딩및학습
6.9요약
참고문헌및역사참고사항
연습

7장.음성학
7.1말소리및발음표기
7.2조음음성학
7.2.1발성기관
7.2.2자음:조음위치
7.2.3자음:조음방식
7.2.4모음
7.2.5음절
7.3음운론적범주및발음변이
7.3.1발음피처
7.3.2발음변이예측
7.3.3발음변이에영향을미치는요인
7.4음향음성학및신호
7.4.1파형
7.4.2음성음파
7.4.3주파수와진폭:피치와음량
7.4.4파형에서단음의해석
7.4.5스펙트럼및주파수영역
7.4.6소스-필터모델
7.5음성리소스
7.6고급:조음및동작음운론
7.7요약
참고문헌및역사참고사항
연습

8장.음성합성
8.1텍스트정규화
8.1.1문장토큰화
8.1.2비표준단어
8.1.3동형이의어의중의성해소
8.2음성분석
8.2.1사전조회
8.2.2명칭
8.2.3문자소의음소변환
8.3운율분석
8.3.1운율구조
8.3.2운율돋들림
8.3.3억양
8.3.4보다정교한모델:ToBI
8.3.5운율레이블에서음의길이연산
8.3.6운율레이블에서F0연산
8.3.7텍스트분석의최종결과:내부표현
8.4다이폰파형합성
8.4.1다이폰데이터베이스구축단계
8.4.2다이폰연결및운율학의TD-PSOLA
8.5음편선택(파형)합성
8.6평가
참고문헌및역사참고사항
연습

9장.자동음성인식
9.1음성인식아키텍처
9.2음성에적용된은닉마르코프모델
9.3피처추출:MFCC벡터
9.3.1프리엠파시스
9.3.2윈도잉
9.3.3이산푸리에변환
9.3.4멜필터뱅크및로그
9.3.5켑스트럼:역이산푸리에변환
9.3.6델타와에너지
9.3.7요약:MFCC
9.4음향우도계산
9.4.1벡터양자화
9.4.2가우시안PDF
9.4.3확률,로그확률및거리함수
9.5어휘목록과언어모델
9.6검색및디코딩
9.7임베디드훈련
9.8평가:단어오류율
9.9요약
참고문헌및역사참고사항
연습

10장.음성인식:고급주제
10.1다중경로디코딩:N-베스트목록및격자
10.2A*(“스택”)디코딩
10.3문맥에따른음향모델:트라이폰
10.4차별적훈련
10.4.1최대상호정보추정
10.4.2사후분류기에기반한음향모델
10.5모델링변화
10.5.1환경변화및잡음
10.5.2화자별변이및화자적응
10.5.3발음모델링:장르에따른변이
10.6메타데이터:경계,구두점및눌변
10.7인간의음성인식
10.8요약
참고문헌및역사참고사항
연습

11장.컴퓨터의음운론
11.1유한상태음운론
11.2고급유한상태음운론
11.2.1조화
11.2.2템플래틱형태론
11.3컴퓨터의최적이론
11.3.1최적이론의유한상태변환기모델
11.3.2최적이론의확률적모델
11.4음절화
11.5음운론및형태론학습
11.5.1음운론적규칙학습
11.5.2형태론적규칙학습
11.5.3최적이론학습
11.6요약
참고문헌및역사참고사항
연습

12장.영어의격식어법
12.1구성요소
12.2문맥자유문법
12.2.1문맥자유문법의형식적정의
12.3영어문법규칙
12.3.1문장레벨의구성요소
12.3.2절과문장
12.3.3명사구
12.3.4일치
12.3.5동사구와하위범주화
12.3.6조동사
12.3.7대등관계
12.4트리뱅크
12.4.1예제:펜트리뱅크프로젝트
12.4.2문법으로서의트리뱅크
12.4.3트리뱅크검색
12.4.4구의중심단어탐색
12.5문법동등성및정규형
12.6유한상태및문맥자유문법
12.7의존성문법
12.7.1의존성과구의중심단어간의관계
12.7.2범주문법
12.8음성언어통사론
12.8.1눌변및정정
12.8.2구어체를위한트리뱅크
12.9문법과언어의프로세싱
12.10요약
참고문헌및역사참고사항
연습

13장.통사론파싱
13.1검색으로파싱
13.1.1하향식파싱
13.1.2상향식파싱
13.1.3하향식및상향식파싱비교
13.2중의성
13.3중의성측면에서검색
13.4동적프로그래밍파싱방법
13.4.1CKY파싱
13.4.2Earley알고리듬
13.4.3차트파싱
13.5부분적인파싱
13.5.1유한상태규칙기반청킹
13.5.2청킹에대한머신러닝기반접근법
13.5.3청킹시스템평가
13.6요약
참고문헌및역사참고사항
연습

14장.통계에근거한파싱
14.1확률론적문맥자유문법
14.1.1중의성해소를위한PCFG
14.1.2언어모델링을위한PCFG
14.2PCFG의확률론적CKY파싱
14.3PCFG규칙확률학습방법
14.4PCFG의문제
14.4.1규칙간의구조적종속성을결여한독립가정
14.4.2어휘종속성의민감성결여
14.5논터미널을분할한PCFG개선
14.6확률론적어휘CFG
14.6.1콜린스파서
14.6.2고급:콜린스파서의추가세부정보
14.7파서평가
14.8고급:차별적재순위화
14.9고급:파서기반언어모델링
14.10휴먼파싱
14.11요약
참고문헌및역사참고사항
연습

15장.피처와결합
15.1피처구조
15.2피처구조의통일
15.3문법의피처구조
15.3.1일치
15.3.2헤드피처
15.3.3하위범주화
15.3.

출판사 서평

◈옮긴이의말◈
우리의생활에가장직접적으로영향을주는영역중하나는음성및언어처리일것이다.최근음성및언어처리는딥러닝기술과함께빠른발전을이뤄냈고AI스피커,챗봇,번역기,리뷰평점분석등실생활속누구나한번쯤사용해본적이있을법한여러분야에서응용되고있다.말한마디로가전제품을제어하고,상담원대기없이챗봇으로문의사항을해결할수있는편리함을제공한다.개인적으로번역기의음성및언어처리발전에큰감사함을느낀다.몇년전에만해도해외여행을준비할때의나는출국전날까지시험공부를하듯이주요문장들을외웠고,외국인과대화할때면무척긴장됐다.하지만최근들어번역기덕분에낯선언어에대한긴장감이사라졌다.기술의발전은점차언어의장벽을넘어인간과인간을더가깝고친근하게만들어주는것같다.앞으로음성및언어처리기술이어떻게발전해서우리의삶을편리하게해줄지기대된다.
아울러이책을통해많은독자가음성및언어처리에대한인사이트를얻고연구에도움을받을수있었으면좋겠다.이책에서는음성및언어처리관련시스템개발에필요한기본에서부터최신기술까지엄청난양의주제를다루고있고,각각의주제를깊이파고든다.내용을따라가다보면음성및언어처리의핵심적인알고리듬을거의다경험해볼수있을것이다.초보자에게알맞은입문서일뿐만아니라전문가에게도차세대자연어처리연구에도움이되리라생각된다.