FREE SHIPING FOR OVER $100 - MOSTLY SHIP VIA USPS GROUND ADVANTAGE %D days %H:%M:%S
남지순
저자:남지순 연세대학교에서학사및석사학위후프랑스파리제7대학(UniversityParis7)에서이론형식언어학박사학위를받았다.이후파리이스트대학교(UPEM)에서컴퓨터언어학아빌리타시옹(Habilitation)학위를취득하였다.귀국후KAIST인공지능연구센터(CAIR)선임연구원을거쳐현재한국외국어대학교언어인지과학과교수로재직중에있다.한국외대디지털언어지식콘텐츠연구센터(DICORA)센터장을맡고있으며,캐나다몬트리올대학교(UDEM)및맥길대학교(McGillUniversity),파리이스트대학교(UPEM)에서초빙교수를역임하였다.한국어전자사전과어휘문법연구,부분문법방법론에대한연구를진행하고있으며,감성분석,챗봇대화,자연어이해등의영역에서필요로하는언어자원및자연어데이터구축방법론에대한연구를수행하고있다.
목차머리말|저자서문ii책의구성|목차iv제1장.자연어추론데이터셋연구동향11자연어추론(NaturalLanguageInference)31.1자연어추론의정의31.2자연어추론(NLI)과초기언어학적고찰82자연어추론데이터셋과벤치마크292.1텍스트함의인식(RTE)데이터셋302.2대규모자연어추론벤치마크의등장322.3어휘?논리?통사기반데이터셋연구442.4상식ㆍ문맥에기반한자연어추론데이터셋연구602.5국내자연어추론학습데이터셋의연구793자연어추론데이터셋구축접근법863.1웹문서기반전제문과크라우드워커의가설문863.2언어학적특징을고려한데이터셋의설계88제2장.언어학적속성기반한국어추론데이터연구91I.논항변환스키마971A01주어와‘N-와’논항의교차1002A02목적어와‘N-와’논항의교차1043A03주어와‘N-에/로’논항의교차1064A04목적어와‘N-에/로’논항의교차1095A05목적어와주어의교차1106A06속격의주격중출문논항으로의변형1147A07속격의목적격중출문논항으로의변형1168A08내포문주격의주절목적격으로의변형1189A09주격의무표격논항으로의변형12010A10목적격의무표격논항으로의변형12211A11부사격의후치사변형12512A12주격논항의삭제13013A13주격중출문의논항삭제13214A14목적격논항의삭제14115A15목적격중출문의논항삭제14216A16동족논항구문의논항삭제14717A17부사격논항의삭제14918A18공지칭대명사논항의삭제15119A19명사구의AND등위접속15520A20명사구의OR등위접속15821A21주격논항의외치등위접속16122A22목적격논항의외치등위접속16323A23부사격논항의외치등위접속165II.술어변환스키마16724P01동사구술어의부정17025P02형용사구술어의부정17226P03명사구술어의부정17627P04술어구이중부정문17828P05술어의수동문변형18429P06술어의시제변형18830P07술어의우언적구성변형19031P08술어의보문절변형19432P09내포문술어의명사화변형19633P10형용사술어의부사화변형19934P11함축동사의삭제20335P12사실동사의삭제21036P13사역동사의삭제21537P14술어의AND등위접속21838P15술어의OR등위접속221III.수식성분변환스키마22739M01수량사/시간표현관형어의변형23040M02상향단조의존재양화사변형23541M03하향단조의보편양화사변형23742M04수관형어의비단조변형23943M05두관형어의교차변형24044M06관형어의위치변형24345M07관형어의삭제변형24546M08관형어의AND등위접속24847M09관형어의OR등위접속25248M10주어의주격관계절변형25849M11주어의비주격관계절변형26350M12비주어논항의주격관계절변형26651M13비주어논항의비주격관계절변형26952M14조건부사절내포문장의변형27253M15양보부사절내포문장의변형27454M16목적부사절내포문장의변형27655M17원인부사절내포문장의변형27856M18시간부사절내포문장의변형28057M19설명부사절내포문장의변형28358M20확신/태도표현문장부사의변형28759M21불확신표현문장부사의변형289IV.어휘?지식변환스키마29360L01명사의유의어어휘변형29661L02명사외범주의유의어어휘변형29862L03명사의반의어어휘변형30163L04명사외범주의반의어어휘변형30464L05비유적?관용적유의어표현변형30865L06부정접두사에의한파생어변형31066L07명사의상위어?하위어어휘변형31367L08명사외범주의상하위어어휘변형31668L09명사의부분어?전체어어휘변형31969L10명사의환유어어휘변형32270L11문화?종교지식에기반한변형32571L12지리적지식에기반한변형32772L13역사적지식에기반한변형32973L14예술적지식에기반한변형33174L15법률?사회적지식에기반한변형33475L16경제?스포츠지식에기반한변형33676L17수리적지식에기반한변형33877L18과학?의학지식에기반한변형34078L19일반상식지식에기반한변형342제3장.KOLINS스키마&KOLIN데이터셋3451KOLINS한국어추론데이터스키마3472KOLIN한국어추론데이터셋구축3533KOLIN데이터셋성능평가364참고문헌371
인간이다른사람의말을듣고,이해하며,이에응답하기위해서는여러가지지적능력을필요로한다.우리들의일상대화는이렇게무수히축적된언어적또는언어외적지식의토대위에서수행되는데,추론(inference)이란바로이러한복합적인지적프로세싱을가능하게하는수많은논리적퍼즐조각들로이루어진다.이책은현재놀라운성능으로인간과대화를수행하는AI언어모델(languagemodel)이아직도여전히많은부분에서인간과같은추론능력을보이지못하는현상이어디에서비롯되는것인지에대한성찰에서출발하였다.이를위한신뢰할수있는학습데이터가제공될때AI모델의추론능력이향상될수있을것이라는데에는이견이없지만,과연이를위한‘자연어추론(NaturalLanguageInference:NLI)’데이터가어떻게구성되어야할것인가의문제에대해서는아직도밝혀내야할내용이산재해있기때문이다.이책에서는AI언어모델의자연어추론능력학습을위해제안된NLI데이터셋의연구동향을소개하고,현재지적되는한계점들을극복하기위해서자연언어의어떠한특징들이고려되어야하는지에대해서고찰하였다.특히한국어에특화된NLI데이터셋을설계하기위해서,어떠한한국어고유의언어적속성들이기술되어야하는지를심층적으로논의하였다.이책은다음세부분으로구성된다.제1장에서는현재자연어추론데이터셋구축연구동향을고찰하고,제2장에서는한국어의통사ㆍ의미적속성에기반한자연어추론데이터셋구축에중요하다고판단되는언어학적현상들을78개유형으로분류하여논의한다.끝으로제3장에서는이유형별속성을통해제안된자연어추론스키마KOLINS와이에따라구축된한국어추론데이터KOLIN(버전V_1.0)에대한소개및성능평가가진행된다.이책은한국어에특화된다양한태스크의AI모델을개발하고자하는개발군연구자들뿐아니라자연어이해를위한언어데이터구축에관심이있는데이터언어학연구자들,그리고한국어의추론관계에관여하는어휘ㆍ통사ㆍ의미적속성들에대한언어학적연구를수행하고자하는이론언어학및한국어학연구자들을대상으로하였다.이책은대학에서의강의와연구를바탕으로시작되었으나,언어모델의파인튜닝(fine-tuning)을위한학습데이터셋구축에필요한실제스키마를제안하는역할을함께수행할수있게되었다.본연구에서분류하여제안하는한국어의언어학적속성유형별성찰을통해,향후언어모델이어떠한통사ㆍ의미적언어현상이해에특히취약한양상을보이는가를파악하고,이를위한맞춤형데이터증강이가능할것으로판단된다.이를통해현재언어모델의한계를극복하기위해왜이와같은‘언어학적접근법(symbolicapproach)’이반드시함께병행되어야하는지를다시한번체험할수있는기회가되기를기대한다.