머신 러닝을 활용한 컴퓨터 보안

머신 러닝을 활용한 컴퓨터 보안

$40.75
Description
2019년 대한민국학술원 우수학술도서 선정도서

컴퓨터 보안 문제를 해결하기 위해 활용할 수 있는 여러 머신 러닝 기술을 다루고 있는 실무 지침서다. 침입 탐지, 악성 코드 분류, 네트워크 분석 컴퓨터 보안 분야에서 계속 연구되고 있는 분야에 대해 소개하며, 최신 연구 주제인 머신 러닝 모델을 공격하기 위한 방법에 대한 연구도 소개한다. 컴퓨터 보안 분야에 종사하는 실무자나 관심이 많은 분들이 머신 러닝을 활용하는 데에 큰 도움이 될 것이다.
저자

클라렌스치오

데프콘(DEFCON)과12개국이상의기타보안/소프트웨어엔지니어링회의와모임에서머신
러닝과보안분야에대한발표,워크숍,교육과정을진행한엔지니어이자기업가다.과거셰이프시큐리티(ShapeSecurity)의보안연구팀원,인텔의커뮤니티스피커,오라클의보안컨설턴트를역임했다.보안데이터과학에대해소수의스타트업에조언하고있으며,샌프란시스코만지역에서가장큰보안데이터과학자모임인사이버보안을위한데이터마이닝모임의창립자이자주최자다.데이터마이닝과인공지능전공으로스탠포드대학교의컴퓨터과학학사및석사학위를취득했다.

목차

1장.왜머신러닝과보안인가?
__사이버위협살펴보기
__사이버공격의경제학
____해킹기술시장
____간접적인이익창출
____결과
__머신러닝은무엇인가?
____머신러닝으로는할수없는것
____머신러닝을사용하는공격자
__실생활에서사용하는보안분야에서의머신러닝적용사례
__스팸메일탐지:반복접근법
__보안분야에서사용하는머신러닝의한계

2장.분류와군집화
__머신러닝:문제와접근법
__머신러닝적용:실사례
__훈련알고리즘배우기
____모델패밀리
____손실함수
____최적화
__지도학습분류알고리즘
____로지스틱회귀
____의사결정트리
____의사결정포레스트
____서포트벡터머신
____나이브베이즈
____k-최근접이웃알고리즘
____신경망
__실상황에서분류문제를풀때고려해야할사항
____모델패밀리선택
____훈련데이터구성
____속성선택
____과적합과과소적합
____임계치의선택과모델간의비교
__군집화
____군집화알고리즘
____군집화결과평가
__결론

3장.비정상탐지
__지도학습대신에비정상탐지를사용해야하는경우
__휴리스틱을사용한침입탐지
__데이터기반방법
__비정상탐지를위한속성공학
____호스트침입탐지
____네트워크침입탐지
____웹애플리케이션침입탐지
____요약
__데이터및알고리즘을이용한비정상탐지
____예측(지도학습기반머신러닝)
____통계적메트릭
____적합도
____비지도머신러닝알고리즘
____밀도기반기법
____요약
__비정상탐지에서머신러닝을사용하는데따른어려움
__대응및완화
__실용적인시스템설계문제
____설명가능성확보
____비정상탐지시스템의유지보수가능성
____인간의피드백통합
____적대효과감소
__결론

4장.악성코드분석
__악성코드이해
____악성코드분류정의
____악성코드의이면
__속성생성
____데이터수집
____속성생성
____속성선택
__속성에서분석까지
____악성코드샘플및레이블을얻는방법
__결론

5장.네트워크트래픽분석
__네트워크방어이론
____접근제어와인증
____침입탐지
____네트워크내의공격자탐지
____데이터중심보안
____허니팟
____요약
__머신러닝과네트워크보안
____캡처에서속성추출
____네트워크위협
____봇넷
__네트워크공격을분류하기위한예측모델구축
____데이터탐색
____데이터준비
____분류
____지도학습
____준지도학습
____비지도학습
____고급앙상블
__결론

6장.소비자웹보호
__소비자웹으로수익창출
__악용유형및데이터를활용한방어
____인증과계정탈취
____계정생성
____금융사기
____봇활동
__악용문제에대한지도학습
____데이터레이블링
____콜드스타트와웜스타트
____거짓양성과거짓음성
____다중응답
____대규모공격
__악용군집화
____예제:스팸도메인군집화
____클러스터생성
____클러스터평가
__군집화의추가지침
__결론

7장.운영시스템
__머신러닝시스템의완성도와확장성정의
____보안머신러닝시스템에서중요한것은무엇일까?
__데이터품질
____문제점:데이터셋의편향
____문제점:레이블의부정확성
____해결책:데이터품질
____문제점:누락된데이터
____해결책:누락된데이터
__모델품질
____문제점:하이퍼파라미터최적화
____해결책:하이퍼파라미터최적화
____속성:피드백루프,A/B모델테스트
____속성:재현가능하고설명가능한결과
__성능
____목표:낮은대기시간과높은확장성
____성능최적화
____분산컴퓨팅프레임워크를사용한수평확장
____클라우드서비스사용
__유지보수,관리
____문제점:모델저장및버전관리,배포
____목표:안정적인성능저하
____목표:손쉬운설정변경
__모니터링및경고
__보안과신뢰성
____속성:공격에대한방어
____속성:개인정보보호및보장
__피드백과사용성
__결론

8장.적대적머신러닝
__용어
__적대적ML의중요성
__머신러닝알고리즘의보안취약점
____공격전이성
__공격기술:모델포이즈닝
____예제:이진분류기포이즈닝공격
____공격자의지식
____포이즈닝공격방어
__공격기술:회피공격
____예제:이진분류기회피공격
____회피공격에대한방어
__결론

부록A.2장보충자료

부록B.오픈소스인텔리전스통합

출판사 서평

★이책에서다루는내용★

■침입,사기,임박한시스템장애등의비정상을신속하게탐지
■컴퓨터바이너리에서유용한정보를추출해악성코드분석수행
■데이터셋내에서패턴을찾아네트워크공격자차단
■공격자가사용자대상웹사이트와앱기능을어떻게악용하는지조사
■머신러닝알고리즘을실험환경에서실무환경으로변환
■공격자가머신러닝솔루션에가하는위협이해

★이책의대상독자★

보안분야에서시스템을개선하기위해머신러닝을사용하거나,머신러닝분야에서보안분야를다루기위해도구를사용하려고한다면,이책이적합하다.
이책은통계에대한기본적인지식을보유하고있다고가정하고서술한다.복잡한수학을다루는대부분의내용은읽지않아도내용을이해하는데에문제가없다.또한프로그래밍언어에익숙하다고가정한다.이책에서다루는내용은개념적인내용을구현하기위해파이썬코드를사용한다.물론오픈소스라이브러리를활용해자바,스칼라(Scala),C++,루비(Ruby)등다른언어로도동일한개념을구현할수있다.

★이책의구성★

이책에서는보안영역중에서도침입탐지,악성코드분류,네트워크분석과같은문제에대한규칙기반또는경험적솔루션을보완하거나대체하기위해머신러닝을적용하는방법을예를들어설명한다.핵심적인머신러닝알고리즘기법을살펴보고보안영역에서유지보수가능하고안정적이면서확장성이우수한데이터마이닝시스템을구축하는데주안점을둔다.예제코드를통해실습하고보안문제가있는환경에서데이터를다루는방법과노이즈에섞여놓칠수도있는중요한신호를식별해내는방법도함께다룬다.