금융 대체 데이터 : 투자자, 트레이더, 리스크 매니저를 위한 안내서
Description
기존의 테이블 형태로 정형화된 데이터를 뛰어 넘어 비정형화된 데이터와 함께 최근 기술의 발전에 따라 더욱 활성화되고 있는 텍스트, 이미지 및 음성 등을 포함한 빅데이터 시대에 번성하는 각종 대체 데이터가 금융 분야에서 어떻게 사용돼야 하고, 현재 어떻게 사용되고 있는가에 대한 소개와 지침 및 실전 예를 제시하는 최초의 책이다. 이에 따라 본서는 머신러닝/딥러닝의 금융 특히 투자/자산운용과의 융합을 더욱 공고히 하는 데에 기여하고, 이에 대한 독자들의 이해를 높이는 최적의 도서가 될 것이다.
저자

알렉산더데네브,사이드아멘

저자:알렉산더데네브(AlexanderDenev)
금융,금융모델링및머신러닝분야에서15년이상의경력을보유하고있으며,현재딜로이트LLP의금융서비스부문(FinancialServices,RiskAdvisory)책임자를맡고있다.전에는IHS마킷(IHSMarkit)에서QuantitativeResearch&AdvancedAnalytics를이끌었으며,분석모델개발을위한센터를설립하고유지했다.
또한스코틀랜드왕립은행(RoyalBankofScotland),소시에테제네랄(SocieteGeneral),유럽투자은행(EuropeanInvestmentBank),유럽투자펀드(EuropeanInvestmentFund)에서일했으며유럽금융안정기구(EuropeanFinancialStabilityFacility)와유럽안정메커니즘(EuropeanStabilityMechanism)의금융공학작업에도참여했다.
이탈리아로마대학교에서인공지능을전공하고물리학석사학위를취득했으며영국옥스퍼드대학교에서수학금융학위를취득했다.스트레스테스트와시나리오분석에서자산배분에이르는주제에관한여러논문과책을썼다.

저자:사이드아멘(SaeedAmem)
Cuemacro의창업자다.15년동안주요투자은행,리먼브라더스,노무라등시스템트레이딩전략과계량지수를개발했다.
Cuemacro를통해시스템트레이딩분야의고객들을위한연구를상담하고출판한다.깃허브(GitHub)에서거래전략을개발하기위한인기있는라이브러리중하나인finmarketpy를포함해많은인기있는오픈소스파이썬라이브러리를개발했다.고객들은주요퀀트펀드를포함했다.
또한블룸버그와레이븐팩(RavenPack)을포함한데이터회사의대체데이터세트에대한수많은연구프로젝트를수행했다.또한퀀트싱크탱크인탈레시안(Thalesian)의공동설립자이며,런던퀸메리대학의객원강사다.
임페리얼칼리지런던에서수학과컴퓨터과학에서1등급우등석사학위를받고졸업했다.

역자:이기홍
카네기멜론대학교에서석사학위를받았고,피츠버그대학교의FinancePh.D,CFA,FRM이자금융,투자,경제분석전문가다.삼성생명,HSBC,새마을금고중앙회,한국투자공사등과같은국내유수의금융기관,금융공기업에서자산운용포트폴리오매니저로근무했으며현재딥러닝과강화학습을금융에접목시켜이를전파하고저변을확대하는것을보람으로삼고있다.저서로는『엑셀VBA로쉽게배우는금융공학프로그래밍』(한빛미디어,2009)이있으며,번역서로는『포트폴리오성공운용』(미래에셋투자교육연구소,2010),『딥러닝부트캠프with케라스』(길벗,2017),『프로그래머를위한기초해석학』(길벗,2018)과에이콘출판사에서펴낸『실용최적화알고리즘』(2020),『초과수익을찾아서2/e』(2020),『자산운용을위한금융머신러닝』(2021),『존헐의비즈니스금융머신러닝2/e』(2021),『퀀트투자를위한머신러닝딥러닝알고리듬트레이딩2/e』(2021),『자동머신러닝』(2021),『금융머신러닝』(2022),『퇴직연금전략』(2022),『A/B테스트』(2022),『행동경제학강의노트3/e』(2022),『실전알고리듬트레이딩레벨업』(2022),『양자경제와금융』(2022)등이있다.누구나자유롭게머신러닝과딥러닝을자신의연구나업무에적용해활용하는그날이오기를바라며매진하고있다.

목차

1장.대체데이터:현황
2장.대체데이터의가치
3장.대체데이터위험과도전과제
4장.머신러닝기법
5장.대체데이터사용배후의프로세스
6장.팩터투자
7장.결측데이터:배경
8장.결측데이터:사례연구
9장.특이치(이상치)
10장.자동차기본데이터
11장.서베이와크라우드소싱데이터
12장.구매자관리지수
13장.인공위성이미지와항공사진
14장.위치데이터
15장.텍스트,웹,소셜미디어및뉴스
16장.투자자관심
17장.소비자거래
18장.정부,산업과기업데이터
19장.시장데이터
20장.사모시장의대체데이터

출판사 서평

추천의글

“대체데이터는오늘날투자운용업계에서가장뜨거운주제다.글로벌경제성장을실시간으로예측하는데사용하든,분기별보고서에서제공하는것보다더세분화된회사의내막을분석하는데사용하든,주식시장의행동을더잘이해하기위해사용하든,대체데이터는자산운용부문의모든사람이포착해야할사항이다.알렉산더데네브와사이드아멘은심지어여전히파이썬을피하는것이가장좋은것이라고생각하는사람들에게도기술적,이론적함정이많은난해한주제를안내할것이다.”
―로빈위글즈워스(RobinWigglesworth)/
글로벌금융특파원,「파이낸셜타임스」

“대체데이터에대해시의적절하고포괄적이며접근하기쉬운토론을만들어준저자들에게축하를전한다.우리가21세기로더나아가면서,이책은빠르게이주제에대해필수로참고해야할연구가될것이다.”
―데이비드핸드(DavidHand)/
런던임페리얼칼리지교수

“지난10년동안대체데이터는일시적정보독점추구의중심이됐다.그러나빈번한사용에도불구하고가치를추출하는데필요한엔드투엔드파이프라인에대해서는거의쓰이지않았다.이책은머신러닝방법과데이터소스에대한실용적인개요뿐만아니라결과에매핑되는모델과함께데이터수집,준비및전처리에많은중요성을부여해누락사항을채운다.저자들은방법론만을고려하는것이아니라통찰력있는사례연구와실제사례를제공하고비용편익분석의중요성을강조한다.대체데이터에서가치를추출하기위해합리적인통찰력과깊은개념적이해를제공하고있으며,이들은이러한기술을거래의핵심에성공적으로포함시키려면필수적이다.”
―스티븐로버츠(StephenRoberts)/
영국옥스퍼드대학교머신러닝교수겸옥스퍼드-맨계량금융연구소소장

“진정한투자의초과성과는데이터와머신러닝과슈퍼컴퓨팅의삼자로부터나온다.알렉산더데네브와사이드아멘은대체데이터에대한최초의종합적인설명서를저술했으며,이는정형화된데이터세트에의해서포착되지않는알파의소스를밝힌다.이책의내용에익숙하지않은자산운용사들은투자자들에게부과하는수수료를벌지못하고있을것이다.”
―마르코스로페즈데프라도(MarcosLopesdePrado)/
코넬대학교수겸TruePositiveTechnologiesLP의CIO

“알렉산더와사이드는중요한주제에대해중요한책을저술했다.나는매일대체데이터에간여하고있지만,여전히책에있는관점을즐기고,많은것을배웠다.대체데이터의힘을활용하고함정을피하고자하는모든사람에게이책을적극추천한다.”
―젠스노르빅(JensNordvig)/
ExtanteData의창립자겸CEO

지은이의말
데이터는점점더많은양으로우리세계에스며든다.이사실만으로는데이터가유용해질수없다.만약데이터에우리의이해를도울수있는정보가없다면,데이터는무익할것이다.데이터가유용하려면통찰력이있어야하며적절한방식으로처리돼야한다.빅데이터시대이전에,세계에대한우리의이해를조명하기위해정형화된데이터세트에서평균,표준편차,상관관계와같은통계량이계산됐다.모델은선형회귀와같은유명한방법을통해출력을얻기위해종종잘‘이해된’작은수의입력변수로추정(calibrate)됐다.
그러나빅데이터(따라서대체데이터)를해석하는데는많은어려움이따른다.빅데이터는양(volume),속도(velocity)및다양성(variety)과같은속성과다른V들로특징지어지며,이책에서논의될것이다.데이터세트가잘정형화되고관련특성들이추출되지않는한통계량을계산하는것은불가능하다.예측과관련해,빅데이터에서도출되는입력변수는엄청나게많고,전통적인통계방법은과적합되기쉽다.더욱이오늘날에는이데이터에대한통계량계산이나모델구축이우리의고빈도세계에서항상변화하는데이터의특성을설명하기위해때때로빈번하게그리고역동적인방식으로수행돼야한다.
기술과방법론의발전덕분에빅데이터를이해하고더나아가대체데이터를이해하는것은다루기쉬운문제가됐다.지저분하고방대한양의데이터에서특성을추출하는것은최근인공지능과머신러닝의발전덕분에이제가능하다.클라우드인프라는유연하고강력한컴퓨팅을통해이러한데이터흐름을관리하고모델을빠르고효율적으로훈련할수있다.오늘날사용되는대부분의프로그래밍언어는오픈소스이며파이썬과같은많은언어들은머신러닝과데이터과학분야에서더많은수의라이브러리를가지고있어기술스택을개발해대규모데이터세트를고속으로처리하기더쉬워졌다.
이책을쓰기로결정했을때이분야의책시장에갭이있다는것을느꼈다.이러한갭은데이터,특히대체데이터의중요성이점점커지고있는것과상충돼보였다.우리는데이터가풍부하고많은데이터셋이비교적저렴한비용으로액세스하고사용할수있는세상에살고있다.따라서데이터를수익성있게사용하는방법에대한과제를해결하기위해긴책을쓸가치가있다고여겼다.그러나대체데이터의세계와그사용사례가가까운미래에바뀔것이라는것을인정한다.그러다보니우리가이책으로닦은길도변할수있다.특히‘대체데이터’라는레이블이곧주류가될수있기때문에더이상사용되지않을수있다.대체데이터는단순히‘데이터’가될수있다.대체데이터를사용할수있도록하기위해오늘날위대한기술적및방법론적위업으로보일수있는것은곧사소한연습이될수있다.우리가상상조차할수없었던출처의새로운데이터세트가등장하기시작할수있고양자컴퓨팅은우리가데이터를바라보는방식에혁명을일으킬수있다.
우리는투자커뮤니티에서이책을목표로하기로결정했다.물론애플리케이션은다른곳,실제로어디에서나찾아볼수있다.금융영역에머무름으로써,이를테면신용결정이나보험가격결정과같은영역도논의할수있었다.우리는투자자가직면할수있는질문에집중하기로결정했고,이책에서이러한특정애플리케이션에대해논의하지않을것이다.물론향후판본에이러한애플리케이션추가를고려할수있다.
집필당시에세상은코로나19로고통받고있었다.의사결정권자가올바른판단을내리는것이매우중요한세상이며,나아가이러한결정은적시에이뤄져야한다.지연되거나잘못된의사결정은현재환경에서치명적인결과를초래할수있다.사람들의도보트래픽을추적하는데이터스트림에대한액세스를갖는것은질병의확산을억제하는데매우중요할수있다.위성또는항공이미지를사용하면대중집회를식별하고공공안전을위해이를분산시키는데도움이될수있다.자산운용사의관점에서볼때공식적인거시경제수치와회사재무제표가발표되기전에나우캐스트를만드는것은더나은투자결정을낳는다.경제의상태를알기위해몇달을기다리는것만으로는더이상충분하지않다.투자자들은그러한점을매우높은빈도로추정할수있기를원한다.최근기술과인공지능의발전은이모든것을가능하게한다.
자,이제대체데이터를통한여정을시작하겠다.여러분이이책을즐기기를바란다!

옮긴이의말
이책은대체데이터의활용에대해서엔드투엔드투자프로세스의관점에서저술한첫번째책이다.무엇보다도머신러닝및딥러닝의인공지능기법이발전함에따라대체데이터로부터가치를용이하게추출할수있게됐다는점을주목하고,이들을적극활용하는방법을추구한다.우선근본적으로데이터의가치에대한체계적인접근을통해데이터를사용할때고려해야할사항을일깨우며,모바일폰데이터,인공위성이미지,위치데이터및텍스트데이터등의다양한형태의대체데이터의소개및머신러닝과딥러닝을통한실제사용사례를소개해독자들이대체데이터를실제로어떻게사용하는지실감할수있도록하고있다.팩터투자의한요소로가치가있다는것을강조하면서기존의투자체계와의통합을동시에추구한다.전통적인데이터과학의고려사항인결측데이터와이상치에대한심도있는분석부터최근각광을받고있는나우캐스팅에관한구체적인접근법에이르기까지상세하게보여주고있어실무적으로도부족함이없어보인다.
이책은향후머신러닝,데이터과학,계량금융,자산운용및규제기관각분야의최전선에서실무를담당하는사람들에게훌륭한참고서역할을하리라믿는다.아울러기존에번역했던머신러닝과딥러닝의많은기법을알고리듬트레이딩에적용한스테판젠슨의책『머신러닝알고리듬트레이딩(에이콘,2022)』,통계학과머신러닝핵심을자산운용에접목함으로써금융머신러닝의레벨을업그레이드시킨마르코스로페즈데프라도의저서들(『자산운용을위한금융머신러닝(2021)』,『실전금융머신러닝완벽분석』(2018))과최첨단금융머신기법을통해신세대금융의길을개척한매튜딕슨,핼퍼린이고르및폴빌로콘의저서『금융머신러닝』(2022)을참고하기를바란다.