부정 적발 애널리틱스 (조직 내 부정 위험 관리를 위한 데이터 과학 지침서)

부정 적발 애널리틱스 (조직 내 부정 위험 관리를 위한 데이터 과학 지침서)

$35.51
Description
데이터 분석을 활용한 가장 완벽한 부정 적발 및 방지 가이드

조직 내 부정은 늘 존재하며, 이를 적절하게 관리하는 것은 매우 중요하다. 이 책은 조직 내 부정을 탐지하는 데 필요한 데이터를 활용하는 최신 부정 적발 및 예방 방법론을 풀이하고 있다. 부정행위 적발 데이터 애널리틱스의 기초에서부터 고급 패턴 인식 방법론, 최첨단 소셜 네트워크 분석 및 부정 조직 적발까지를 면밀히 안내한다. 보험부정, 탈세, 신용카드 부정과 같은 다양한 실제 부정 사례를 통해 부정 적발의 실무적인 적용에 초점을 맞추었다.
통찰력 있는 이 안내서를 통해 부정 애널리틱스에 대해 그리고 부정과의 싸움에서 과거 데이터를 활용할 수 있는 비결에 대해 명확히 알 수 있을 것이다.
저자

바르트바선스

벨기에루벤대학교(KULeuven)경영경제대학정보시스템엔지니어석사과정을상위10%(magnacumlaude)로마치면서석사학위논문주제인“MiningDataonTwitter”를통해교수진이선정하는최우수논문상을수상했다.2012년에는루벤대학교경제경영대학의사결정과학및정보관리(DecisionSciencesandInformationManagement)학부에서바르트바선스교수의PhD과정을진행하며연구원으로재직했으며,재직기간동안정부기관과금융기관을위해고도화된네트워크기반부정적발접근법을개발했다.주요연구주제는소셜네트워크분석,부정적발,넷리프팅모델링이다.

목차

제1장_부정:적발,예방,그리고애널리틱스!
1.서론|2.부정|3.부정적발및예방|4.부정적발을위한빅데이터|5.데이터를기반으로한부정적발|
6.부정적발기술|7.부정주기|8.부정애널리틱스처리모형|9.부정데이터과학자|10.부정에대한과학적관점|
참고문헌

제2장_데이터수집,표본추출,전처리(前處理)
1.서론|2.데이터원천의유형|3.데이터의병합|4.표본추출|5.데이터요소유형|
6.시각적데이터탐색및탐색적통계분석|7.벤포드의법칙|8.기술통계량|9.결측값|10.이상치적발및처리|
11.위험신호|12.데이터표준화|13.범주화|14.증거력코딩|15.변수선택|16.주성분분석|17.리디트|
18.프리디트분석|19.세분화|참고문헌

제3장_부정적발을위한기술적애널리틱스
1.서론|2.그래픽이상치적발절차|3.통계적이상치적발절차|4.군집화|5.K-평균군집화|
6.단일등급서포트벡터머신|참고문헌

제4장_부정적발을위한예측적애널리틱스
1.서론|2.목표변수의정의|3.선형회귀|4.로지스틱회귀|5.선형및로지스틱회귀분석을위한변수선택|
6.의사결정나무|7.신경망|8.서포트벡터머신|9.앙상블기법|10.다등급분류기술|11.예측모형의평가|
12.예측적분석모형에대한기타성능측정치|13.편향된데이터집합을위한예측적모형의개발|
14.부정적발성능벤치마크|참고문헌

제5장_부정적발을위한소셜네트워크분석
1.네트워크의형태,구성요소,특징,활용|2.부정은사회적현상인가?동질선호성개론|3.이웃의영향:측정지표|
4.커뮤니티마이닝:부정관련집단의발견|5.그래프확장:이원적관계의도표화|참고문헌

제6장_부정애널리틱스:후처리
1.서론|2.분석적부정모형의생애주기|3.모형표현|4.조사대상표본선정|5.부정경보및사례관리|
6.시각적분석|7.분석적부정모형의평가|8.모형설계및문서화|참고문헌

제7장_부정애널리틱스에대한더넓은견해
1.서론|2.데이터품질|3.프라이버시|4.부정손실의자본산정|5.부정애널리틱스에대한경제적관점|
6.인소싱vs.아웃소싱|7.모델링의확장|8.사물인터넷|9.기업부정거버넌스|참고문헌

출판사 서평

조직의부정,가장효과적인적발관리방법은무엇인가
데이터의‘흔적’분석을통한부정위험관리시스템이필요하다

오랫동안뛰어난성과를내오던글로벌기업도제대로부정위험을관리하지못하면빠르게무너진사례가많다.이렇듯조직내부정위험은기업의존폐를가르는아주중요한사실이나,이를관리하는기업의자원에는한계가있다.부정이전혀발생하지않도록관리하는것은불가능할뿐만아니라설사무결점으로관리한다하더라도이에대한비용이엄청나게들것이다.제한된자원을제대로활용하여최대한효과적으로부정위험관리를하는것이기업의목표일것이다.
이제는많은기업이시스템을통해업무를수행하고있고,그시스템내에는임직원들이업무를하면서남긴‘흔적’이곳곳에데이터혹은로그상태로남아있다.만일완벽히시스템을통해서만업무를수행하고이러한흔적들을의미있는정보로활용할수있는기술을접목하여그의미를제대로이해할수만있다면,이론적으로그회사가목표로했던무결점부정위험관리는가능할수도있을것이다.

급변하는경영환경속최선의조직관리를위하여

이책은기업내존재하는수많은‘흔적’을다양한통계적기법이나각종기술들을활용하여부정위험관리를할수있는방안을제시해주고있다.최근의기술적이고예측적인분석및소셜네트워크분석이어떻게과거의데이터에서부정패턴을학습하여부정에맞서싸우는지를이책은생생하게보여준다.기업은정보의홍수와급변하는경영환경속에직면해있으며,이러한환경하에서이책에서제시하는통찰을기반으로기업에맞는부정위험관리방식을새롭게정립하고제대로구축및운영함으로써업무의변화를도모하고자한다.

기업조직에서의부정의양태그리고적발및예방
부정적발및예방을위한시스템과모형을알아본다

모두7장으로구성된이책의제1장에서는기술적(descriptive),예측적(predictive)기법및소셜네트워크기법을이용한부정애널리틱스를소개한다.부정의정의와특징에대한설명을시작으로다양한종류의부정에대해논의한다.이어서부정이미치는영향과발생건수를줄이기위한부정적발및예방에대해논의한다.빅데이터와애널리틱스는기업의부정적발시스템을향상시킬수있는강력한도구를제공한다.이러한도구들이어떻게그리고왜전통적인전문가기반의부정적발접근법들을보완하는지를자세히살펴본다.그다음데이터기반의부정적발시스템을개발하고실행하는단계들의높은수준의개요를설명하는부정애널리틱스처리모형이소개된다.제1장은이주제에대한과학적인시각과훌륭한부정데이터과학자에게요구되는특징과기술들을언급하며마무리된다.

부정관리를위한데이터관리의중요성
데이터가전처리(前處理)단계에서확실하게검증되고문서화되기위하여

제2장은모든부정애널리틱스모형의기본요소인데이터에대한폭넓은설명을제공한다.여러종류의데이터원천과데이터들의병합및표본화하는방법에대해소개한다.이어서데이터요소의다른유형,시각적탐색,벤포드의법칙과기술통계학에대해논의한다.이러한것들은이용가능한데이터의특징과한계의이해를시작하기위한모든필수적인도구이다.결측값(missingvalues)처리,이상치(outlier)적발및처리,이상징후(redflags)의정의,데이터표준화,변수범주화,증거력코딩(weightofevidencecode)의가중치,변수선택과같은데이터전처리작업(datapreprocessingactivity)또한광범위하게다루어진다.또한입력데이터의차원수축소기술인주성분분석(PCA)이설명되며,이는리디트(RIDIT)및프리디트(PRIDIT)분석으로실증된다.제2장은세분화(segmentation)와그에따른위험요소에대한검토로끝이난다.

부정관리를위한다양한방법들
기술적애널리틱스의비지도기술방법들

제3장은부정적발에사용되는기술적애널리틱스(descriptiveanalytics)에대한설명으로시작된다.여기서아이디어는부정이포함된데이터집합에서비정상적인패턴이나이상치들을발견하는것으로,도표및통계상의이상치적발절차에대해우선검토한다.이후중단점분석(break-pointanalysis),동료집단분석(peergroupanalysis),연관규칙(associationrules),군집화(clustering),단일등급서포트벡터머신(one-classSVMs)에대한개요를제공한다.

기술적분석혹은비(非)지도학습은평균적인행동이나표준에서벗어나는일반적이지않고비정상적인행동을찾아내는것을목표로한다.표준은여러방법으로정의할수있다.평균적인고객의특정시점의행위또는특정시간고객층의평균적행위로,혹은이둘을합친것으로정의할수도있다.다음장에서언급이되겠지만예측적분석혹은지도학습은기존에알려진부정관련성거래가포함된과거데이터집합이있는것으로가정한다.그렇기때문에만들어진분석모형은과거에일어났던부정패턴만을적발해낼수있으며,결과적으로기존에알려지지않았던부정을적발해내는것은불가능하다.하지만예측적애널리틱스는기술적분석에서찾은비정상(anomalies)을설명하는데유용하게쓰일수있다._107쪽

예측적애널리틱스로부정적발의모형만들기

제4장은부정적발을위한예측적애널리틱스(predictiveanalytics)에대해서다룬다.개별거래가이분법적혹은연속적으로표시되어있는데이터집합으로부터예측모형을만들기위해필요한선형회귀분석(linearregression),로지스틱(logistic)회귀분석,의사결정나무(decisiontree),신경망(neuralnetworks),서포트벡터머신(supportvectormachines),앙상블기법(ensemblemethods),다등급분류(multiclassclassification)와같은분석기술들에대해논의하고,예측모형의성능을측정하기위해데이터집합을나누는방법과조치에대해설명한다.또한등급불균형문제를광범위하게설명하며,일부성능벤치마크에대한내용으로마무리한다.

예측적애널리틱스는관심있는목표(target)의측정치를미리예측해볼수있는모형을만드는것이다.모형을만든후에목표는전통적으로최적화절차기간에학습과정을조정하는데사용된다.예측적애널리틱스는목표의측정수준에따라회귀(regression)와분류(classification)라는두가지종류로구별된다.회귀(regression)에서목표변수(종속변수)는연속적이며미리정해진구간을따라변한다.해당구간은제한적(예:0과1사이)일수도있고무제한적(예:0과무한대사이)일수도있다.부정적발환경에서회귀가쓰이는전통적인예로는부정금액의예측이있다.분류(classification)에서목표는범주형으로서,이미정의된제한된범위안에서만값을가질수있는것을의미한다.이항분류에서는고려대상이2개의등급(예:부정관련자vs.부정무관련자)만인반면,다등급분류에서대상은2개이상의등급이속할수있다(예:심각한부정,보통부정,부정무관)._153쪽

소셜네트워크분석을통한부정적발

제5장은독자들에게소셜네트워크분석(socialnetworkanalysis)이어떻게부정적발에이용되고있는지에대해소개한다.부정에대한경향은종종사회의주변환경에의해영향을받기때문에사람대사람간관계의주요요소들을설명하고사회적관계내에서어떻게거래데이터의출처가변형될수있는지를보여준다.그다음네트워크에서의미있는특성들을추출해내는특성화(featurization)에대해설명한다.우리는이러한특성들을근접지표(neighborhoodmetrics),중심점지표(centralitymetrics),집합추론알고리즘(collectiveinferencealgorithms)의세가지주요유형으로구분한다.그후네트워크내서로밀접하게연결되어있는부정관련자들을찾아내는커뮤니티마이닝에대해살펴본다.다중그래프(multipartitegraph)에대한소개로부정은복수의서로다른요인에의해영향을받으며,해당요인들을기준으로부정에대한더나은이해와적발이가능한점이기술된다.그리고실제사회보장부정사례를예시로끝을맺는다.

온라인소셜네트워크사이트의이용자는다른사람들과의관계를분명히드러낸다.결과적으로,소셜네트워크사이트는실제세계에존재하는관계와(거의)완벽하게일치한다.우리는당신이누구인지와취미및관심사,결혼여부,자녀수,매주조깅을함께하는친구들,와인클럽에서만난친구들등을알고있다.어찌되었든이렇게연결된네트워크의정보와지식은매우흥미로운자료이다.마케팅관리자는적절한캠페인을만드는데필요한사람을추측할필요가없다.그런정보는어디든존재한다.그리고바로그것이문제이다.소셜네트워크사이트는보유한데이터와자료의풍부함을인정하지만해당데이터를무료로공유할생각은없다.또한이러한데이터는종종사유화되고규제되며상업적인용도로사용되지않는다.반면소셜네트워크사이트는관리자및기타이해관계자에게정확한네트워크를게시하지않고도소셜네트워크를활용해마케팅캠페인을시작하고관리할수있는다양하고훌륭한내부시설들을제공한다._245쪽

부정애널리틱스모형의후처리와그방법들
기술적,예측적애널리틱스및소셜네트워크분석을통해구축한‘분석적부정모형’

제6장은부정애널리틱스모형의후처리(postprocessing)에대해다루는데,이는분석적부정모형주기(analyticalfraudmodellifecycle)에대한개요로시작된다.또한인기있는모형표시방법인신호등지표(trafficlightindicator)접근법과의사결정테이블(decisiontable)을논의하고조사대상샘플선정과관련된가이드라인,경고및부정발생시대처(casemanagement)등에대해설명하며시각적인애널리틱스가후처리작업에어떻게기여할수있는지를보여준다.데이터와모형의안정성(stability),그리고모형보정(modelcalibration)을통해분석적인부정모형의평가(backtest)방법을설명한다.이장은모형의설계와문서화에대한가이드라인을제공하며마무리된다.

분석단계의결과물은기술적,예측적기법그리고소셜네트워크또는이를결합한기법을사용하여구축된분석적부정모형(analyticalfraudmodel)이다.기본적으로분석모형은부정의발생여부혹은부정금액을예측하는수학공식으로귀결된다.다음단계에서이모형또는공식은현존하는비즈니스환경또는ICT(InformationandCommunicationTechnologies)시스템에통합되어야한다.이과정을성공적으로완수하기위해서는필요조건을완벽하게이해하는것이중요하며,이는주로분석모형의최종사용자들에의해지정된다.더나아가모형을작동시킨이후에도부정행위의변화에맞춰성능의저하를적시에탐지하고그에상응하는적절한조치를취할수있도록면밀하게모니터링해야한다._319쪽

부정적발애널리틱스의확장된견해
데이터의품질문제,그리고개인정보의문제

제7장은부정애널리틱스에대한더넓은시야를갖기위해데이터품질문제에대한인지및관리가이드라인,프라이버시와내/외부데이터에대한접근권한설정에대한다양한방법에대해논의한다.또한애널리틱스부정추정치가기대하거나기대하지못한손실을산출하는데어떻게사용될수있는지에대해논의하는데,이는충당금및자본금확충(provisioningandcapitalbuffer)에대한의사결정에도움을줄수있다.부정애널리틱스와관련된총소유비용(totalcostofownership)과투자대비효익,분석모형의내부개발대비아웃소싱에대한논의가이