파이썬으로 배우는 음성인식 (음성인식의 기술 발전 동향부터 파이토치를 활용한 딥러닝 실습까지)

파이썬으로 배우는 음성인식 (음성인식의 기술 발전 동향부터 파이토치를 활용한 딥러닝 실습까지)

$27.00
Description
음성인식의 기초부터 파이토치를 활용한 딥러닝 실습까지,
파이썬으로 배우는 음성인식 도서 출간!
음성인식이란 음성 신호로부터 발화 내용을 인식하는 기술, 즉 컴퓨터가 사람의 음성을 신호로 인식하여 처리하는 기술이다. AI 스피커와 스마트폰 음성 어시스턴트 등 음성인식 기술들은 이미 우리의 일상생활 속으로 깊이 스며들어 있다. 음성 번역 시스템의 전처리 단계, 회의록 자동 작성 시스템 등 다양한 곳에서 음성인식 기술이 사용된다. 특히나 음성인식 기술은 손을 사용하지 않고(Hands-free) 기계를 작동시킬 수 있어, 차량 내비게이션과의 연동 혹은 신체장애인의 입력 장치 등 다양한 방면에서 성장이 기대되는 기술이다.

이 책은 지금까지의 음성인식 기술의 역사와 기술 발전 동향을 이해하고, 파이썬과 파이토치를 통해 최신 음성인식 시스템을 실습한다. 음성인식의 목적이나 알고리즘의 개요를 설명하고, 소스 코드를 상세하게 분석하고, 마지막으로 소스 코드를 첨부하여 독자들이 직접 구현할 수 있도록 한다. 특히 인공지능기술이 만들어진 목적이나, 해당 기술로 목적을 달성할 수 있을지에 대해 명확히 제시한다. 이 책은 음성인식을 제대로 구현하고자 하는 개발자 및 학부생에게 꼭 필요한 필독서가 될 것이다.
저자

다카시마료이치

高島遼一
2013년고베대학대학원시스템정보학연구과박사후기과정수료(공학박사)

2011년4월~2013년3월일본학술진흥회특별연구원[DC2].2013년4월에㈜히타치제작소연
구개발그룹에입사하여장비이상검사와음성인식을위한잡음제거등,음성및음향신호처
리에관한연구개발에종사했다.2016년10월부터2018년9월까지국립연구개발법인정보통
신연구기구에전출하여음성인식에관한연구개발에종사했다.2019년4월부터고베대학도
시안전연구센터겸동대학원시스템정보학연구과준교수로부임했고,현재는음성인식기반
의음성처리,기계학습기술과복지분야응용관련연구에종사하고있다.

목차

제1장음성인식이란?
제1절음성인식은무엇이며,어디에사용되는가?
제2절음성을인식한다는것은?-음성인식원리-
제3절이책의목적과구성

제2장음성인식기초지식
제1절음성인식과확률
제2절음성인식문제를수식으로정의하기
제3절텍스트종류와발음사전-음소ㆍ히라가나ㆍ문자ㆍ단어-
제4절음성인식실험두가지
제5절음성인식실험프로세스

제3장음성처리기초와특징추출
제1절데이터준비하기
제2절음성파일읽어보기
제3절푸리에변환으로음성을주파수분해하기
제4절음성을단시간푸리에변환하여스펙트럼생성하기
제5절로그MelFilterBank특징
제6절Mel주파수켑스트럼특징
제7절특징의평균과표준편차계산해보기

제4장음성인식첫걸음DPMatching
제1절음성인식에서떼어놓을수없는정렬(얼라인먼트)문제
제2절DPMatching
제3절DPMatching구현해보기

제5장GMM-HMM기반음성인식
제1절템플릿이아닌,분포와빈도관점
제2절정규분포와최빈추정법을활용한매개변수추정
제3절혼합정규분포(GMM)와EM알고리즘
제4절은닉마코프모델(HMM)
제5절GMM-HMM구현하기

제6장DNN-HMM기반음성인식
제1절‘분포’에서‘DeepNeuralNetwork’로
제2절DeepNeuralNetwork
제3절DNN과HMM을조합한DNN-HMM하이브리드시스템
제4절DNN-HMM을파이썬과파이토치로구현해보기
제5절HMM기반대어휘연속음성인식

제7장End-to-End모델기반연속음성인식
제1절하이브리드시스템에서FullNeuralNetworkModel로
제2절순환신경망(RecurrentNeuralNetwork)
제3절Connectionisttemporalclassification(CTC)
제4절CTC를파이썬과파이토치로구현해보기
제5절Attentionencoder-decoder모델
제6절Attention모델을파이썬과파이토치로구현해보기
제7절기타기법과음성인식모델
제8절참고문헌

출판사 서평

음성인식머신러닝모델을파이썬으로구현및실습하기위한
'음성인식기초이론및단계별실습서'

음성인식기술은나날이발전해가고있습니다.중요한회의나강의내용을필사해야할경우과거에는녹음기를사용했지만최근에는음성인식노트앱을사용합니다.또한핸드폰에깔려있는애플시리,구글어시스턴트,삼성빅스비혹은집에하나씩가지고있는스마트스피커,차량에서사용하는내비게이션앱에서지원하는음성인식등,음성인식은이미우리의일상에스며들었습니다.음성인식은최근들어딥러닝모델링을기반으로급격한기술적도약을경험하며인식품질이개선되었지만,여전히완벽한음성인식에도달하기위해서는더많은데이터와모델이필요합니다.잡음이섞인음성,복수의사람이동시에이야기를할때의음성인식등현실적으로풀어야할문제들이많습니다.

이책은과거부터현재까지의음성인식기술발전의변천사를다루고있습니다.과거의음성인식기법이현재의음성인식기술에미친영향에대해마치이야기를들려주듯이설명하고있습니다.또한음성인식기술에많이사용되는확률과신호처리이론을포함한음성인식의각기법에대한이론적지식과실습코드를제공하며,딥러닝을이용한최신음성인식시스템을파이썬과파이토치를활용하여직접개발해볼수있도록돕습니다.

이책의저자는처음음성인식을접하는독자분들에게음성인식기술의이해를넘어서음성인식기술의전체적인흐름과특징을이해할수있게끔집필하였습니다.향후음성인식기술이어떻게더발전해나갈지관심있으신분과현업에빠르게음성인식기술을적용해보고싶으신분,음성처리및기계학습전반에관심이있는분,그리고앞으로진지하게음성인식기술에대해서배우고싶은분들에게이책을추천합니다.