Data Lake 플랫폼 아키텍처

Data Lake 플랫폼 아키텍처

$25.00
Description
기업의 비즈니스 방향을 고려한 빅데이터 서비스 플랫폼을 설계하자!
글로벌 대형 기업들은 ‘디지털 전환(Digital Transformation)’을 핵심 현안으로 추진하고 있습니다. 이 과정에서 Data Lake 구축은 가장 중요한 과제 중 하나일 것입니다. 다른 기업들처럼 ‘람다 아키텍처‘를 기반으로 하여 하둡 에코시스템을 활용해서 구축하면 되는 것일까요? 아니면 AWS 혹은 Azure의 Public Cloud 서비스를 활용하여 구축하면 되는 것일까요? 우리 기업의 비즈니스에 적합한 Data Lake 아키텍처는 무엇일까요? 이러한 ‘중요한 질문들’에 대한 해답을 얻고자 한다면 이 책을 반드시 읽어야 할 것입니다.

ㆍ 빅데이터 참조 아키텍처(람다 vs. 카파)
ㆍ 빅데이터 솔루션 아키텍처(Cloudera vs. AWS vs. Azure)
ㆍ Data Lake 아키텍처 설계 기본원칙
ㆍ 단기와 장기 개념 아키텍처의 설계
ㆍ 아키텍처 설계 시 주요 의사결정 사항
ㆍ 구성요소별 상세 아키텍처 설계
저자

윤선웅

1999년S/W개발자로커리어를시작하여,15년이상경영컨설턴트와IT컨설턴트로서업무를수행해왔습니다.주로IT전략기획업무를수행하였으며,최근에는빅데이터전략,데이터플랫폼전략,DataLake프로젝트수행과관련문헌작성에전념하고있습니다.

학력
-경남과학고등학교졸업
-KAIST기계공학과학사
-KAIST경영대학원경영정보MBA

주요경력
-시스템엔지니어(LGCNS)
-경영/IT컨설턴트(A.T.Kearney/(전)밸텍컨설팅/딜로이트컨설팅)

주요저서
《차세대빅데이터플랫폼DataLake》,좋은땅,2021.
《DataCatalog만들기》,좋은땅,2021.

목차

머리말

제1장DataLake개요
1.DataLake의등장배경
2.DataLake의중요성
3.DataLake의개념
4.DataLake구성요소

제2장DataLake참조아키텍처
1.빅데이터참조아키텍처
1-1.람다아키텍처
1-2.카파아키텍처
1-3.참조아키텍처간비교
2.빅데이터솔루션아키텍처
2-1.ClouderaHadoop
2-2.ClouderaDataPlatform
2-3.AWSDataLake
2-4.AzureDataLake
2-5.솔루션아키텍처간비교

제3장DataLake아키텍처설계
1.아키텍처설계기본원칙
2.아키텍처설계방향
2-1.단기아키텍처
2-2.장기아키텍처
2-3.설계시주요의사결정사항
3.구성요소별아키텍처설계
3-1.데이터수집Layer
3-2.데이터적재Layer
3-3.데이터처리Layer
3-4.데이터제공Layer
3-5.사용자Self-ServiceLayer
3-6.데이터거버넌스Layer

맺음말
참고자료
색인

출판사 서평

이책은저자의DataLake시리즈의세번째책으로,DataLake플랫폼의청사진(Blueprint)을설계하기위한실무자들을위한책이다.

첫번째책인《차세대빅데이터플랫폼DataLake》는DataLake플랫폼의전반적인개요를다루었고,DataLake가무엇이고,무엇을목적으로하는지를알려준다.두번째책인《DataCatalog만들기》는DataLake플랫폼의핵심서비스라고할수있는DataCatalog서비스를소개하고,이를어떻게설계하고구축해야하는지에대한방법론과예시를중심으로기술하였다.세번째책인이책에서는DataLake의전체플랫폼을어떻게설계할지에대한내용을기술하였다.

DataCatalog는‘사용자Self-ServiceLayer’의하나의구성요소에불과하지만,DataLake플랫폼은많은구성요소와기술요소를포함하고있는복잡한시스템이다.DataLake아키텍트는이러한많은구성요소를정의하고기술을검토하고아키텍처를설계해야한다.

하지만이들아키텍트가참고할수있는자료는사실상해외자료몇권과이를번역한자료정도이며,이자료들은‘람다아키텍처’를기반으로한아주대략적인구현모습만을제공하고있다.DataLake설계를위한참고자료가부족한상황에서,저자의지난3년간의DataLake프로젝트수행과리서치경험을바탕으로좀더종합적인관점에서설계를위한기초자료를제공한다.