AI가 내려온다

AI가 내려온다

$16.50
Description
AI라는 호랑이 등에 올라타고
고전 문학을 종횡무진 내달린
강우규, 김바로 두 인문학자의 진솔한 기록!
AI의 시대는 융합의 시대.
고전 문학 연구의 미래가 여기에 있다!
2022년 8월, 콜로라도 주립 미술 대회의 디지털아트 부문에서 제이슨 앨런(Jason Allen)의 「스페이스 오페라 극장(Theatre D'opera Spatial)」이 1위에 올랐다. 별로 특별하지 않아 보이는 이 이야기가 화제가 된 것은, 이 그림이 텍스트로 된 설명문을 몇 초 만에 이미지로 바꾸어 주는 인공 지능(artificial intelligence, AI) 프로그램 미드저니(MidJourney)가 그렸다는 사실이 밝혀지면서부터였다.
이처럼 AI가 ‘마인드 스포츠(mind sports)’ 최후의 보루였던 바둑을 제패한 2016년 ‘알파고 쇼크’ 이후 운전, 번역, 심지어 문학과 예술까지 인간만의 영역이라 여겨졌던 분야를 향한 AI의 진격이 최근 몇 년간 이어지고 있으며, 그 끝이 유토피아일지, 디스토피아일지는 아직 알 수 없는 상황이다.
이런 상황에서 AI라는 호랑이의 등에 용감하게 올라타, 고전 문학의 첩첩산중을 내달린 두 인문학자가 있다. 바로 강우규 중앙대학교 교수와 김바로 한국학중앙연구원 연구원이 그 주인공이다. 이번에 ㈜사이언스북스 신간으로 출간된 『AI가 내려온다: 인공 지능 시대의 고전 문학 연구』는 두 저자가 디지털 분석의 방법론을 실제 사례에 적용해, 고전 문학 작품에 대한 새로운 연구 가능성을 제시한 「AI 인문학 시리즈」의 네 번째 책이다.
저자

강우규

중앙대학교HK+인공지능인문학사업단HK연구교수이다.중앙대학교국어국문학과를졸업하고,같은대학교대학원에서문학박사학위를받았다.현대의대중서사인웹툰,드라마,영화등의문화콘텐츠에대한관심을가지고연구를진행하고있고,고전서사의텍스트한정성문제를극복하기위하여인공지능을활용하는융합연구를진행하고있다.논문으로는「디지털맵핑(Mapping)을활용한구운몽연구및교육적활용」,「바리이야기의웹툰수용양상과
의미고찰」,「딥러닝을활용한경판방각본소설의유형고찰」등이있다.

목차

책을시작하며:고전문학과디지털인문학의만남5
1강프롤로그:인공지능이내려온다11
2강디지털문체분석과고전문학27
3강디지털감정분석과고전문학95
4강에필로그:AI라는범을어떻게다룰것인가?159
후주171
찾아보기175

출판사 서평

고전소설「소현성록」과「구운몽」에대한
AI디지털분석이보여주는인문학의미래
이책은두저자가중앙대학교HK+인공지능인문학사업단의HK연구교수로서,인공지능시대가도래하면서가능해진새로운방법론으로고전소설을분석한기록이다.주된분석대상이된텍스트는17세기국문소설인「소현성록」연작과「구운몽」으로,「소현성록」연작은중세중국을배경으로소현성과그부인들의이야기가주를이루는본전「소현성록」과소현성의여러아들과그부인들의이야기가주를이루는별전「소씨삼대록」으로구성되어국문장편소설의효시로불리는작자미상의작품이다.「구운몽」은현실세계의젊은승려성진이하룻밤꿈속에서주인공양소유로분해겪는팔선녀와의연애와성공담을통해진정한삶이란무엇인가를묻는,17세기소설사를대표하는서포김만중의국문소설이다.
두저자는2018년당시학계에서는생소하게만여겨졌던고전문학과디지털인문학의융합을위해두작품의인문데이터를처음부터구축하고,형태소분석,계층분석,감정분석,사회네트워크분석,딥러닝분석등의다채로운기법을최적화해디지털분석을진행했다.

역사속숨겨진「소현성록」연작의저자를찾는모험:
디지털문체분석과고전문학
궁극적으로는0과1로세상을인식하는컴퓨터가어떻게사람의특징적인문체를판별할수있을까?우선컴퓨터가문체적인특징을형태로인지한다는사실을이해해야한다.예를들어우리가텍스트에서“이순신”을검색하면그결과를얻지만,의미상으로거의동일하지만형태가다른“충무공”은검색이되지않는다.이처럼컴퓨터는맥락을파악하는데는매우취약하지만특정형태가전체문장에서몇번등장했는지는빠르고정확하게처리할수있다.
그렇기에컴퓨터로진행하는기본적인문체판별은텍스트에서특정형태들의등장빈도를상호비교하는통계적방식으로이루어진다.특정텍스트에‘엇디’가많이나오고,다른텍스트에서도‘엇디’가많이나온다면두텍스트는서로유사할가능성이크다.사실이런작업자체는연구자도수행할수있다.다만컴퓨터보다엄청나게오랜시간이걸릴뿐이다.최근에는특정형태가다른형태와이루는조합이나동일한의미를갖는다른형태에대해서도정확한분석을수행하기위해인간의뇌를모방해내재적인유사의미를유추하는딥러닝(deeplearning)방식을사용하고있다.
2장‘디지털문체분석과고전문학’에서두저자는기본적인형태를통계적으로분석하는방식과딥러닝방식두가지모두를통해고전소설을연구했다.먼저「소현성록」연작을대상으로통계적분석을거쳐그동안베일속에감추어져있던저자의정체를확인하는작업에한걸음더나아갔으며,크게다섯종류가존재하는「소현성록」연작판본간의상관관계및변이양상을파악하는시도를했다.딥러닝방식으로는경판방각본고전소설을대상으로고전소설의유형을탐색했다.

숲을보면서나무도놓치지않기:
디지털감정분석과고전문학
인간처럼자연적으로감정을인지하지못하는컴퓨터는감정사전(sentimentlexicon)을토대로감정을인지한다.감정사전은‘눈물’을‘슬픔’혹은‘부정’이라는감정이라고서술하고,‘웃음’은‘기쁨’혹은‘긍정’이라는감정과대응시키는식으로특정형태소와감정을짝지어정리한목록이다.
그런데이방법에는맥락을파악하지못하는문제가있다.이를해결하기위해최근에는문장의맥락까지반영하는딥러닝방법이사용되고있다.딥러닝방법에는문장과그문장의감정을라벨링한빅데이터가필수적으로요구되는데,아직현대한국어에대한감정데이터조차부족한상황이고제대로된한국어기반디지털감정사전도공개된것이없다.
3장‘디지털감정분석과고전문학’에서두저자는이런상황에서고전문학작품의디지털감정분석을위해1)영어로된빅데이터기반감정사전을사용하는방법과2)설문조사방식을통해고전문학작품에나타난감정을수동으로입력,빅데이터보다정교한스몰데이터(smalldata)를구축해분석하는두가지제안을제시했다.영어감정사전기반빅데이터감정분석방식으로는「소현성록」연작을,스몰데이터를구축하는방식으로는「구운몽」의감정을각각분석했다.

융합연구를꿈꾸는
미래의디지털인문학자들을위해
연구결과는연구라는첩첩산중을구르고넘어지고좌절하는수많은과정에서겨우건져낸아름다운풍광이다.그연구과정대부분은아름답지않지만,그결과때문에미화되고는한다.마지막4장‘AI라는범을어떻게다룰것인가?’에서두저자는진솔한대담을나누며고전문학과디지털인문학의융합에서의발생하는현실적인어려움이무엇인지를이야기한다.
하나는분석을위한인문데이터의구축이고,다른하나는분석결과를이해할수있도록인문학계에설명하는일이다.후자의문제는노력을들이면해결가능하다.비록새로운방법론이라도인문텍스트자체는인문학자들이평생을보아온것이기때문이다.데이터에익숙하지않고,디지털분석결과를해석할능력이약한인문학자에게는오히려인문데이터의구축이더큰문제라는것이다.
이를극복할방안으로그들이제시하는것은인문데이터를구축하는기초연구사업의지속적확대운영이다.이와함께한가지주제에어떠한분석기술을활용가능한지를인문학자도쉽게이해할수있도록서술한『AI가내려온다』같은책을꾸준히만들어,익숙함에안주하지않고새로운것에도전하는용기를가진자신같은연구자들이계속나타날수있도록하겠다는것이또한가지의해법이자두저자의다짐이다.

현단계에서의고전문학과디지털인문학의융합연구는기존연구에서논의된내용을통계적수치를통해객관적으로증명하게된다.새로운방법론이고전문학연구에서유의미하다는점을보여주어야했기때문이다.그런데온갖수치와그림을통해어렵게증명한융합연구의결과가기존의고전문학연구와큰차이가없었기때문에,굳이생소하고어려운연구를수행할이유를찾지못했을것이다.하지만기존과는완전히다른방식으로기존의연구와유사한결과가나온다는것자체가무서운일이라고생각한다.새로운방식에서는명확한근거와재현성을제공해주기때문이다.현재는기존학설을다른방식으로탐색하고있지만,새로운연구방법의정합성이인정된이후에는디지털분석을통해도출된전통적인연구결과와상이한지점에대해서도접근을시도할것이다.그리고이러한지점들은곧인간과컴퓨터의융합으로만볼수있는새로운지평이될것이다.
-「책을시작하며」에서