실전 금융 머신 러닝 완벽 분석

실전 금융 머신 러닝 완벽 분석

$40.00
Description
2019년 대한민국학술원 우수학술도서 선정도서

머신러닝을 금융에 적용하는 방법을 알려주며, 이론 연구를 넘어선 실전 경험을 바탕으로 어떠한 장점과 위험이 존재하는 것인지 빠짐없이 설명한다. 저자가 20년 간 금융에서 실제로 적용해 본 머신러닝 기법에 대해 각각의 장단점과 함께 개별 기법들을 상세히 설명한다. 또 금융에 맞는 데이터 구조, 모델링, 백테스팅, 유용한 금융적 특징, 고성능 컴퓨팅에 이르기까지 최고 전문가의 시각에서 전달해 주는 실전 지식을 빠짐없이 나열한다.
대부분의 금융 머신러닝 프로젝트가 실패하는 이유와 성공적인 금융 머신러닝 프로젝트를 위해서 어떠한 요소가 갖춰져야 하는지 설명하고 있다. 특히 대부분 프로젝트가 저지르는 백테스팅의 오류를 심도 있게 설명한다.
메타-전략 패러다임의 효용성과 중요성을 설명해 주며, 대부분 성공한 프로젝트가 활용하고 있는 메타-전략 패러다임을 예제와 함께 잘 설명한다. 이 책은 그 깊이로 인해 머신러닝과 금융에 대한 최소한의 지식을 갖춰야 이해할 수 있지만, 최소한의 지식이 바탕이 되고 나면 책에서 다루고 있는 깊이 있고 실용적인 내용으로부터 많은 도움을 받을 수 있다.
저자

마르코스로페즈데프라도

지은이:마르코스로페즈데프라도(MarcosLopezdePrado)
머신러닝과슈퍼컴퓨팅을이용해수십억달러의기금을운용하고있다.구겐하임파트너의정량금융투자전력(QIS)사업을설립해뛰어난리스크조정수익률을지속적으로가져다준고용량전략을개발했다.130억달러의자산을운용한후QIS를인수하고2018년구겐하임에서스핀아웃했다.
2010년부터로렌스버클리국립연구소(미에너지성,과학국)의연구원으로일하고있다.금융에서가장많이읽은10대도서의저자(SSRN순위기준)로,머신러닝과슈퍼컴퓨팅에관련된수십편의논문을썼고,알고리즘거래에대한다수의국제특허를갖고있다.
1999년에스페인국립학문상을수상했고,2003년에는금융경제학으로박사학위를받았으며,2011년에는마드리드대학에서수학적금융으로두번째박사학위를받았다.박사후과정을하버드와코넬대학에서마쳤으며,공학부에서금융머신러닝과정을가르쳤다.미국수학학회에따른에르도스2(Erdos#2)와아인슈타인4(Einstein#4)를갖고있다.
자세한내용은www.QuantResearch.org에서확인할수있다.  

옮긴이:이병욱
㈜크라스랩대표이사이자,한국외국어대학교겸임교수로재직중이다.한국과학기술원(KAIST)전산학과계산이론연구실에서학사및석사학위를취득했다.공학을전공한금융전문가로,세계최초의핸드헬드-PC(Handheld-PC)개발에참여해한글윈도우CE1.0과2.0을마이크로소프트에서공동개발했다.1999년에는국내최초전보험사보험료실시간비교서비스를제공한㈜보험넷을창업해업계에큰반향을불러일으켰다.이후삼성생명을비롯한생명및손해보험사에서CMO(마케팅총괄상무),CSMO(영업및마케팅총괄상무)등을역임하면서혁신적인상품과서비스를개발및총괄했다.세계최초로파생상품ELS를기초자산으로한변액보험을개발해단일보험상품으로5,000억원이상판매되는돌풍을일으켰고,매일분산투자하는일분산투자(DailyAveraging)변액보험을세계최초로개발해상품판매독점권을획득했다.최근에는머신러닝기반의금융분석과블록체인에관심을갖고다양한활동을하고있다.저서로는『비트코인과블록체인,탐욕이삼켜버린기술』(에이콘출판,2018)이있다.  

목차

1장.독립된주제로서의금융머신러닝
__1.1동기
__1.2금융머신러닝프로젝트가실패하는주요원인
____1.2.1시지프스패러다임
____1.2.2메타전략패러다임
__1.3책의구조
____1.3.1생산체인에의한구조
____1.3.2전략구성요소에따른구조
____1.3.3흔한함정에의한구성
__1.4대상독자들
__1.5필요지식
__1.6FAQs
__1.7감사의글
__연습문제
__참고자료
__참고문헌

1부.데이터분석

2장.금융데이터구조
__2.1동기
__2.2금융데이터의근본적형태
____2.2.1기초데이터
____2.2.2시장데이터
____2.2.3분석
____2.2.4대체데이터
__2.3바
____2.3.1표준바
____2.3.2정보-주도바
__2.4복수상품계열다루기
____2.4.1ETF트릭
____2.4.2PCA가중치
____2.4.3단일선물롤
__2.5특징표본추출
____2.5.1축소를위한표본추출
____2.5.2이벤트기반의표본추출
__연습문제
__참고자료

3장.레이블링
__3.1동기
__3.2고정시간수평기법T
__3.3동적임계치계산
__3.4트리플-배리어기법
__3.5위치와크기파악
__3.6메타-레이블
__3.7메타-레이블을이용하는방법
__3.8퀀터멘털방법
__3.9불필요한레이블제거
__연습문제
__참고문헌

4장.표본가중치
__4.1동기
__4.2결과중첩
__4.3공존레이블의개수
__4.4레이블의평균고유성
__4.5배깅분류기와고유성
____4.5.1순차적부트스트랩
____4.5.2순차적부트스트랩의구현
____4.5.3수치적예제
____4.5.4몬테카를로실험
__4.6수익률기여도
__4.7시간-감쇄
__4.8부류가중치
__연습문제
__참고문서
__참고문헌

5장.분수미분의특징
__5.1동기
__5.2정상성대기억딜레마
__5.3문헌리뷰
__5.4기법
____5.4.1장기기억
____5.4.2반복적계산
____5.4.3수렴
__5.5구현
____5.5.1확장하는윈도우
____5.5.2고정-너비윈도우Fracdiff
__5.6최대기억유지정상성
__5.7결론
__연습문제
__참고문서
__참고문헌

2부.모델링

6장.앙상블기법
__6.1동기
__6.2오류의세가지원인6.3부트스트랩종합
____6.3.1분산축소
____6.3.2개선된정확도
____6.3.3관측중복
__6.4랜덤포레스트
__6.5부스팅
__6.6금융에있어서의배깅대부스팅
__6.7배깅의확장성
__연습문제
__참고자료
__참고문헌

7장.금융에서의교차-검증
__7.1동기
__7.2교차-검증의목표
__7.3금융에서K-폴드CV가실패하는이유
__7.4해법:퍼지된K-폴드CV
____7.4.1훈련집합에서의퍼지
____7.4.2엠바고
____7.4.3퍼지된K-폴더클래스
__7.5SKLEARN의교차-검증버그
__연습문제
__참고문헌

8장.특징중요도
__8.1동기
__8.2특징중요도의중요성
__8.3대체효과와특징중요도
____8.3.1평균감소불순도
____8.3.2평균감소정확도
__8.4대체효과가없는특징중요도
____8.4.1단일특징중요도
____8.4.2직교특징
__8.5병렬화대스택화특징중요도
__8.6합성데이터를사용한실험
__연습문제
__참고문서

9장.교차-검증을통한초매개변수설정
__9.1동기
__9.2그리드검색교차-검증
__9.3랜덤화검색교차-검증
____9.3.1로그-유니폼분포9.4점수화및초매개변수튜닝
__연습문제
__참고문서
__참고문헌

3부.백테스팅

10장.베팅크기
__10.1동기
__10.2전략-독립베팅크기방식
__10.3예측된확률로부터베팅크기조절
__10.4활성화베팅의평균화
__10.5크기이산화
__10.6동적베팅크기와한계가격
__연습문제
__참고문서
__참고문헌

11장.백테스팅의위험
__11.1동기
__11.2미션임파서블:결함없는백테스트
__11.3비록백테스트결과가나무랄데가없어도아마도잘못됐을것이다
__11.4백테스트는연구도구가아니다
__11.5몇가지일반적인추천
__11.6전략선택
__연습문제
__참고문서
__참고문헌

12장.교차-검증을통한백테스팅
__12.1동기
__12.2워크-포워드기법
____12.2.1워크-포워드기법의위험
__12.3교차-검증기법
__12.4조합적퍼지교차-검증기법
____12.4.1조합적분할
____12.4.2조합적퍼지교차-검증백테스트알고리즘
____12.4.3몇가지예제
__12.5조합적퍼지교차-검증이백테스트과적합을해결하는법
__연습문제
__참고문서

13장.합성데이터에대한백테스트
__13.1동기
__13.2거래규칙.
__13.3문제
__13.4프레임워크
__13.5최적거래규칙의수치적결정
____13.5.1알고리즘
____13.5.2구현
__13.6실험적결과
____13.6.1제로장기균형의경우
____13.6.2양의장기균형경우
____13.6.3음의장기균형경우
__13.7결론
__연습문제
__참고문서

14장.백테스트통계량
__14.1동기
__14.2백테스트통계량의종류
__14.3일반적인특성
__14.4성과
____14.4.1수익률의시간-가중치비율
__14.5런
____14.5.1수익률집중
____14.5.2드로우다운과수면하시간
____14.5.3성과평가를위한런통계량
__14.6거래비용구현
__14.7효율성
____14.7.1샤프지수
____14.7.2확률적샤프지수
____14.7.3줄어든샤프지수
____14.7.4효율성통계량
____14.8분류점수
__14.9속성
__연습문제
__참고문서
__참고문헌

15장.전략리스크이해
__15.1동기
__15.2대칭투자회수금
__15.3비대칭투자회수금
__15.4전략실패의확률
____15.4.1알고리즘
____15.4.2구현
__연습문제
__참고문서

16장.전략리스크이해
__16.1동기
__16.2컨벡스포트폴리오최적화문제
__16.3마코위츠의저주
__16.4기하로부터계층적관계까지
____16.4.1트리군집화
____16.4.2유사-대각화
____16.4.3재귀적이분
__16.5수치예제
__16.6외표본몬테카를로시뮬레이션
__16.7향후연구과제
__16.8결론

부록
__16.A.1상관관계-기반척도
__16.A.2역분산할당
__16.A.3수치예제재생
__16.A.4몬테카를로실험재현
__연습문제
__참고문서

4부유용한금융의특징

17장.구조적변화
__17.1동기
__17.2구조적변화테스트종류
__17.3CUSUM테스트
____17.3.1재귀적잔차에브라운-더빈-에반스CUSUM테스트
____17.3.2레벨에대한추-스틴치콤베-화이트CUSUM테스트
__17.4폭발성테스트
____17.4.1초-형태디키-풀러테스트
____17.4.2상한증강디키-풀러
____17.4.3서브-또는슈퍼-마틴게일검정
__연습문제
__참고문서

18장.엔트로피특징들
__18.1동기
__18.2샤논의엔트로피
__18.3플러그인(또는최대-우도)예측기
__18.4렘펠-지프예측기
__18.5인코딩체계
____18.5.1이진인코딩
____18.5.2분위수인코딩
____18.5.3시그마인코딩
__18.6가우스프로세스의엔트로피
__18.7엔트로피와일반화된평균
__18.8엔트로피의몇가지금융응용
____18.8.1시장효율성
____18.8.2최대엔트로피새성
____18.8.3포트폴리오집중화
____18.8.4시장미시구조
__연습문제
__참고문서
__참고문헌

19장.미시구조적특징
__19.1동기
__19.2문헌고찰
____19.31세대:가격시퀀스
____19.3.1틱규칙
____19.3.2롤모델
____19.3.3고-저변동성예측기
____19.3.4코윈과슐츠
__19.42세대:전략적거래모델
____19.4.1카일의람다
____19.4.2아미후드의람다
____19.4.3하스브룩의람다
__19.5제3세대:순차적거래모델
____19.5.1정보-기반거래의확률
____19.5.2정보-기반거래의거래량-동기화확률
__19.6미시구조적데이터세트로부터의추가특징
____19.6.1주문크기의분포
____19.6.2취소율,지정가주문,시장가주문
____19.6.3시간-가중평균가격실행알고리즘
____19.6.4옵션시장
____19.6.5부호가있는주문흐름의계열상관관계
__19.7미시구조적정보란무엇인가?
__연습문제
__참고문서

5부.고성능컴퓨팅비법

20장.다중처리와벡터화
__20.1동기
__20.2벡터화예제
__20.3단일-스레드대다중-스레딩대다중처리
__20.4원자와분자
____20.4.1선형분할
____20.4.2이중루프분할
__20.5다중처리엔진
____20.5

출판사 서평

이책은머신러닝을금융에적용하는것이어떤것이며,어떠한장점과위험이존재하는것인지빠짐없이설명한다.
저자가20년간금융에서실제로적용해본머신러닝기법에대해각각의장단점과함께개별기법들을상세히설명한다.또금융에맞는데이터구조,모델링,백테스팅,유용한금융적특징,고성능컴퓨팅에이르기까지최고전문가의시각에서전달해주는실전지식을빠짐없이나열한다.
대부분의금융머신러닝프로젝트가실패하는이유와성공적인금융머신러닝프로젝트를위해서는어떠한요소가갖춰져야하는지설명하고있다.특히대부분프로젝트가저지르는백테스팅의오류를심도있게설명한다.
메타-전략패러다임의효용성과중요성을설명해주며,대부분성공한프로젝트가활용하고있는메타-전략패러다임을예제와함께잘설명한다.이책은그깊이로인해머신러닝과금융에대한최소한의지식을갖춰야이해할수있지만,최소한의지식이바탕이되고나면책에서다루고있는깊이있고실용적인내용으로부터많은도움을받을수있다.

★이책의대상독자★

특히금융관련데이터에연계된문제들을해결하기위해설계된고급머신러닝기법에대해다루고있다.'고급'이라는의미가이해하기가극도로힘들다거나딥러닝,순환신경망,컨볼루션망등최근에되살아나고있는기법들을설명한다는의미는아니다.그보다는금융문제에머신러닝알고리즘을적용한경험이있는상급연구원들이주요하게생각하는여러의문에해답을주기위해쓰여졌다.만약머신러닝이처음이고,복잡한알고리즘에대한경험이없다면이책이적합하지않을수있다.이책에서다루고있는문제에대해현업에서의경험이없다면이책을이용해문제해결하는것이쉽지않을것이다.이책을읽기전에머신러닝에대한여러훌륭한책을읽길권한다.
이책은금융이외의여러분야에머신러닝알고리즘을성공적으로구현한경험이있는데이터과학자들에게도적합하다.만약여러분이구글에서일하면서딥신경망을얼굴인식에대해성공적으로구현한적이있지만,금융쪽으로는제대로구현해본적이없다면이책이많은도움이될것이다.

★이책의구성★

이책은서로얽혀있는주제들을각각구분해정돈된형태로설명한다.각장은그이전장을읽었다고가정하고설명한다.1부는금융데이터를머신러닝알고리즘에서잘다룰수있도록구성할수있게도와준다.2부는해당데이터에대해어떤식으로연구할지에대해알아본다.여기서중요한것은연구를하거나과학적프로세스를통해실질적인발견을하는것이며,이는우연히어떤(잘못될가능성이많은)결과가나타날때까지의미없이반복하는연구기법과는구분된다.3부는연구에대한백테스트방법에대해설명하고결과가잘못될확률을평가해본다.이세가지를통해데이터분석으로부터모델을연구하고,결과를평가하는전체프로세스를개괄할수있게된다.이러한지식을바탕으로4부는데이터로되돌아가의미있는특징을추출하는혁신적인방법을설명한다.마지막으로이러한작업들은대부분상당한양의자원을소모하게되므로5부에서는유용한HPC비법에대해알아본다.