그래프 알고리즘 (스파크와 Neo4j로 이해하는 알고리즘과 그래프 분석)

그래프 알고리즘 (스파크와 Neo4j로 이해하는 알고리즘과 그래프 분석)

$33.14
Description
그래프 분석과 알고리즘, 이론에 대한 소개로 시작해서 그래프 알고리즘에 초점을 맞춘 경로 찾기, 중심성, 커뮤니티 감지 등을 간략하게 설명한다. 알고리즘의 기능 설명을 확인할 수 있고, 알고리즘에 대한 사용 사례와 자세한 내용을 볼 수 있다. 또한 스파크, Neo4j에서 알고리즘 사용 방법을 제공하는 구체적인 예제 코드를 통해 이론의 활용이 가능하다. 그래프 분석으로 모든 조직의 복잡한 시스템과 대규모 네트워크의 동작을 파악할 수 있으며, 그래프 분석을 더 잘 활용해서 새로운 발견을 하고 지능형 솔루션을 더 빠르게 개발할 수 있을 것이다.
저자

마크니덤

(MarkNeedham)
Neo4j의그래프Advocate이자개발엔지니어다.사용자가그래프와Neo4j를수용하게돕고까다로운데이터문제에대한정교한솔루션을구축했다.이전에Neo4j의인과클러스터링(CausalClustering)시스템구축을도왔고그래프데이터에대한깊은전문성을지니고있다.인기블로그(https://markhneedham.com/blog/)에그래피스타경험에대해기고하고있으며트위터는@markhneedham(https://twitter.com/markhneedham)을사용한다.

목차

1장.시작하기
__그래프란?
__그래프분석과알고리즘은무엇인가?
__그래프프로세싱,데이터베이스,질의,알고리즘
____OLTP와OLAP
__그래프알고리즘에관심을가져야하는이유
__그래프분석사례
__결론

2장.그래프이론과개념
__용어
__그래프타입과구조
____랜덤,작은세상,척도독립구조
__그래프가갖는여러특징
____연결과비연결그래프
____비가중그래프와가중그래프
____비방향성그래프와방향성그래프
____비순환그래프와순환그래프
____희소그래프와밀집그래프
____일분,이분,k분그래프
__그래프알고리즘의타입
____경로찾기
____중심성
____커뮤니티검출
__요약

3장.그래프플랫폼과프로세싱
__그래프플랫폼과프로세싱고려사항
____플랫폼고려사항
____프로세싱고려사항
__대표적인플랫폼
____플랫폼선택
____아파치스파크
____Neo4j그래프플랫폼
__요약

4장.경로찾기와그래프탐색알고리즘
__예제데이터:운송그래프
____데이터를아파치스파크로불러오기
____데이터를Neo4j로불러오기
__너비우선탐색
____너비우선탐색(아파치스파크활용)
__깊이우선탐색
__최단경로
____언제최단경로를사용해야하는가?
____최단경로(Neo4j사용)
____최단경로(Neo4j사용)
____최단경로(가중치적용,아파치스파크사용)
____최단경로의변형(Variation):A*
____최단경로의변형:옌의k-최단경로
__모든쌍의최단경로
____모든쌍의최단경로를자세히알아보기
____모든쌍의최단경로를사용해야할경우
____모든쌍의최단경로(아파치스파크사용)
____모든쌍의최단경로(Neo4j사용)
__단일출발최단경로
____단일출발최단경로를사용해야할경우
____단일출발최단경로(아파치스파크사용)
____단일출발최단경로(Neo4j사용)
__최소신장트리
____최소신장트리를사용해야할경우
____최소신장트리(Neo4j사용)
__랜덤워크
____랜덤워크를사용해야할경우
____Neo4j를사용한랜덤워크
__요약

5장.중심성알고리즘
__그래프데이터예:소셜그래프
____아파치스파크로데이터가져오기
____Neo4j로데이터가져오기
__연결중심성
____도달
____연결중심성을사용해야할경우
____연결중심성(아파치스파크사용)
__근접중심성
____근접중심성을사용해야할경우
____근접중심성(아파치스파크사용)
____근접중심성(Neo4j사용)
____근접중심성변형:와서만과파우스트
____근접중심성변형:조화중심성
__매개중심성
____매개중심성을사용해야할경우
____매개중심성(Neo4j사용)
____매개중심성변형:랜덤근사브랜드
__PageRank
____영향력
____PageRank공식
____반복동작,랜덤서퍼,랭크싱크
____PageRank를사용해야할경우
____PageRank(아파치스파크사용)
____PageRank(Neo4j사용)
____PageRank변형:개인화된PageRank
__요약

6장.커뮤니티검출알고리즘
__예제그래프데이터:소프트웨어종속성그래프
____아파치스파크로데이터가져오기
____Neo4j로데이터가져오기
__트라이앵글수와결집계수
____지역결집계수
____전역결집계수
____트라이앵글수와결집계수를사용해야할경우
____트라이앵글수(아파치스파크사용)
____Neo4j사용한트라이앵글
____지역결집계수(Neo4j사용)
__강한연결요소
____강한연결요소를사용해야할경우
____강한연결요소(아파치스파크사용)
____강한연결요소(Neo4j사용)
__연결요소
____연결요소를사용해야할경우
____연결요소(아파치스파크사용)
____연결요소(Neo4j사용)
__레이블전파
____준지도학습과시드레이블
____레이블전파를사용해야할경우
____레이블전파(아파치스파크사용)
____레이블전파(Neo4j사용)
__루뱅모듈성
____루뱅을사용해야할때
____루뱅(Neo4j사용)
__커뮤니티검증
__요약

7장.실전그래프알고리즘
__Neo4j를사용한옐프데이터분석
____옐프소셜네트워크
____데이터불러오기
____그래프모델
____옐프데이터개요
____여행계획애플리케이션
____여행비즈니스컨설팅
____유사카테고리찾기
__아파치스파크로항공사비행데이터분석
____탐색적분석
____인기있는공항
____ORD에서지연
____SFO의좋지않은비행날짜
____항공사별상호연결공항
__요약

8장.머신러닝향상을위한그래프알고리즘
__머신러닝과문맥의중요성
____그래프,콘텍스트,정확도
__연결특징추출과선택
____그래프특징
____그래프알고리즘특징
__실전그래프와머신러닝:링크예측
____도구와데이터
____Neo4j로데이터가져오기
____공동저자그래프
____균형된훈련과테스트용데이터세트만들기
____누락된링크를예측하는방법
____머신러닝파이프라인생성
____링크예측:기본그래프특징
____링크예측:트라이앵글과결집계수
____링크예측:커뮤니티검출
__요약
__전체내용요약

부록.추가정보와자원
__기타알고리즘
__Neo4j대량데이터가져오기와옐프
____APOC와다른Neo4j도구
__데이터세트찾기
__아파치스파크와Neo4j플랫폼지원
__훈련

출판사 서평

★이책에서다루는내용★

■데이터에서그래프분석으로더많은예측요소를나타낼수있는방법
■인기있는그래프알고리즘의작동방식과적용방식
■20개이상의그래프알고리즘예제의샘플코드와팁
■다양한유형의상황에서어떤알고리즘을사용할지알아보기
■스파크와Neo4j용작업코드,샘플데이터세트를포함한예제
■Neo4j와스파크를결합해링크예측을할수있는ML워크플로작성

★이책의구성★

처음두개장에서는그래프분석,알고리즘과이론에대한소개를제공한다.세번째장에서는고전적인그래프알고리즘(경로찾기,중심성,커뮤니티감지)에초점을맞춘세가지내용을상세히살펴보기전에사용된플랫폼을간략하게설명한다.워크플로내에서그래프알고리즘이사용되는방식을보여주는두개의장으로책을마무리한다.하나는일반분석용이고다른하나는머신러닝용이다.

★이책의대상독자★

아파치스파크™또는Neo4j를사용해본경험이있는개발자와데이터과학자가그래프알고리즘을시작할수있도록돕는실용적인가이드다.알고리즘예제는스파크와Neo4j플랫폼을활용하지만선택한그래프기술에관계없이좀더일반적인그래프개념을이해하는데도도움이될수있다.