데이터ㆍAI 시스템 아키텍트를 위한 실무 가이드 (데이터 사이언스 기초부터 장애복구와 고가용성 설계까지, AI 시스템 설계 실전 전략)

데이터ㆍAI 시스템 아키텍트를 위한 실무 가이드 (데이터 사이언스 기초부터 장애복구와 고가용성 설계까지, AI 시스템 설계 실전 전략)

$42.38
Description
데이터 사이언스 전문가로 도약하기 위한 모든 지식과 실무 노하우를 한 권에 담았습니다!
많은 조직이 서비스에 데이터와 AI 기술을 도입하고자 하지만, 이를 실제 운영 환경에 구현하고 안정적으로 운영하는 과정은 결코 간단하지 않다. 데이터 수집, 저장, 처리부터 모델 배포 및 관리에 이르기까지 전반적인 과정을 유기적으로 다룰 수 있는 역량이 필요하며, 다양한 기술을 체계적으로 통합해 일관되게 운영할 수 있어야 한다.

실무자들은 '데이터와 AI를 활용하고 싶지만, 어디서부터 어떻게 설계하고 구성해야 할지 모르겠다'라는 문제에 종종 직면한다. 개별 기술에는 능숙하더라도, 전체 시스템 관점에서 이를 연계하고 운영하는 데 어려움을 겪는 경우가 많다. 이로 인해 프로젝트의 초기 설계부터 운영에 이르기까지 여러 단계에서 시행착오를 반복하곤 한다.

이 책은 데이터 사이언스의 기초 이론을 시작으로 데이터 엔지니어링, 모델 운영, 시스템 아키텍처 설계, 운영 전략에 이르는 흐름을 폭넓게 다룬다. 로그 설계, 마이크로서비스 전환, 성능 최적화, 보안, 비용 관리 등 실무에서 자주 접하는 주제를 포함하여, 다양한 직무의 실무자가 참고할 수 있는 아키텍처 중심의 실전 해법을 제시한다.

★ 이 책에서 다루는 내용 ★

◎ 데이터 분석, 시각화, 탐색적 분석 등 데이터 사이언스의 핵심 이론
◎ 머신러닝과 딥러닝 모델 설계 개요 및 주요 응용 분야 소개
◎ 데이터 수집, 전처리, 통합, 거버넌스 등 데이터 엔지니어링 실무
◎ 데이터 저장 설계, 아키텍처 패턴, 데이터 파이프라인 구축
◎ 워크플로 설계, 배치 처리 및 실시간 처리 시스템 설계와 비교
◎ API 설계, 모델 배포, CI/CD, 성능 모니터링 및 MLOps 개념
◎ 로그 아키텍처 설계, Elastic Stack, 실험 설계(A/B 테스트) 원칙
◎ 마이크로서비스, 분산 시스템, 병목 분석 및 개선 등 시스템 설계 전략
◎ 캐싱, 로드밸런싱, 오토스케일링 등 시스템 최적화 및 운영 기술
◎ LLM 및 RAG 시스템 구성 전략 등 최신 AI 아키텍처 적용 사례
◎ 데이터 보안, 개인정보 보호, 장애 대응, 백업/복원, 고가용성 설계 가이드
◎ 클라우드 비용 최적화, SLA 설정, 운영 비용 관리 전략
저자

윤대희

카카오스타일의데이터사이언스팀리더로,자연어처리,컴퓨터비전,추천시스템등다양한AI기반프로젝트를이끌고있다.데이터리터러시,데이터패브릭,MLOps등데이터활용체계를다뤘왔으며,데이터품질관리와통합,비즈니스인텔리전스분야에도폭넓게관여해왔다.기술공유와확장가능한플러그인개발등다양한개인프로젝트를통해조직과개인이데이터를보다효과적으로활용하도록돕고있다.

목차

[PART01]데이터사이언스기초편

▣1장:데이터의이해
1.1데이터의정의와종류
___1.1.1데이터유형
___1.1.2데이터속성
1.2데이터분석
___1.2.1통계적모델링
___1.2.2데이터분석프로세스
___1.2.3데이터분석예시
1.3데이터시각화
___1.3.1시각화의종류
___1.3.2시각화원칙
1.4탐색적데이터분석
___1.4.1탐색적데이터분석체크리스트
___1.4.2탐색적데이터분석예시

▣2장:머신러닝의기초
2.1머신러닝개념
___2.1.1머신러닝의비즈니스목표및도입고려사항
___2.1.2머신러닝으로해결가능한문제정의및고려사항
2.1머신러닝의학습원리
___2.1.1순전파
___2.2.2활성화함수
___2.2.3손실함수
___2.2.4최적화알고리즘
___2.2.5역전파
2.3모델성능개선및평가
___2.3.1과대적합과과소적합
___2.3.2정규화기법
___2.3.4모델평가지표
___2.3.5모델선택과하이퍼파라미터튜닝
2.4머신러닝모델적용예시
___2.4.1머신러닝의주요접근방식
___2.4.2머신러닝적용사례
___2.4.3모델적용시고려사항

▣3장:딥러닝의핵심
3.1기초신경망모델
___3.1.1다층퍼셉트론
___3.1.2합성곱신경망
___3.1.3순환신경망
3.2생성및표현학습모델
___3.2.1오토인코더
___3.2.2생성적적대신경망
3.3도메인특화신경망모델
___3.3.1그래프신경망
___3.3.2심층Q-네트워크
3.4최신딥러닝모델
___3.4.1트랜스포머
___3.4.2디퓨전모델
___3.4.3대규모언어모델
___3.4.4MoE모델

▣4장:딥러닝응용분야
4.1자연어처리
___4.1.1데이터전처리
___4.1.2모델아키텍처
___4.1.3모델학습및평가
___4.1.4핵심모델
___4.1.5필수논문
___4.1.6주요라이브러리및도구
4.2오디오처리
___4.2.1데이터전처리
___4.2.2모델아키텍처
___4.2.3모델학습및평가
___4.2.4핵심모델
___4.2.5필수논문
___4.2.6주요라이브러리및도구
4.3컴퓨터비전
___4.3.1데이터전처리
___4.3.2모델아키텍처
___4.3.3모델학습및평가
___4.3.4핵심모델
___4.3.5필수논문
___4.3.6주요라이브러리및도구
4.4강화학습
___4.4.1데이터전처리
___4.4.2모델아키텍처
___4.4.3모델학습및평가
___4.4.4핵심모델
___4.4.5필수논문
___4.4.6주요라이브러리및도구
4.5추천시스템
___4.5.1데이터전처리
___4.5.2모델아키텍처
___4.5.3모델학습및평가
___4.5.4핵심모델
___4.5.5필수논문
___4.5.6주요라이브러리및도구
4.6데이터사이언스로드맵
___4.6.1자연어처리
___4.6.2오디오처리
___4.6.3컴퓨터비전
___4.6.4강화학습
___4.6.5추천시스템
___4.6.6확장기술스택

[PART02]데이터사이언스실전편

▣5장:데이터엔지니어링
5.1데이터수집
___5.1.1데이터수집방식
___5.1.2데이터수집파이프라인
___5.1.3파이프라인설계시고려사항
5.2데이터전처리
___5.2.3데이터정제
___5.2.2데이터변환
___5.2.3특징공학
___5.2.4데이터불균형처리
___5.2.5데이터전처리예시
5.3데이터거버넌스
___5.3.1데이터거버넌스구성요소
___5.3.2데이터거버넌스도구
___5.3.3데이터거버넌스도구도입시기

▣6장:데이터저장및설계
6.1데이터저장및관리
___6.1.1관계형데이터베이스관리시스템
___6.1.2NoSQL
___6.1.3벡터데이터베이스
___6.1.4데이터일관성및무결성유지전략
6.2데이터아키텍처패턴
___6.2.1데이터저장및관리아키텍처
___6.2.2데이터모델링기법
___6.2.3OLAP과OLTP시스템
___6.2.4클라우드기반데이터웨어하우스
6.3데이터파이프라인설계
___6.3.1ETL과ELT
___6.3.2데이터수집,변환,저장단계별설계원칙
___6.3.3데이터파이프라인설계고려사항
___6.3.4분산데이터환경에서의데이터파이프라인최적화

▣7장:모델운영및관리
7.1API설계원칙
___7.1.1RESTfulAPI
___7.1.2RESTfulAPI디자인및구현
___7.1.3GraphQL소개
___7.1.4API게이트웨이역할및기능
7.2모델배포
___7.2.1모델배포환경선택기준
___7.2.2모델배포방식및시나리오
___7.2.3모델버전관리및롤백전략
7.3모델성능모니터링
___7.3.1모델모니터링과성능분석
___7.3.2모델드리프트감지방법
___7.3.3모델재학습전략
7.4CI/CD와MLOps
___7.4.1CI/CD파이프라인
___7.4.2MLOps
___7.4.3MLOps플랫폼
___7.4.4MLOps파이프라인설계및구축전략

▣8장:데이터처리파이프라인
8.1워크플로설계
___8.1.1요구사항정의및목표설정
___8.1.2워크플로단계별설계
___8.1.3기술스택선정
___8.1.4워크플로모니터링및개선
8.2배치처리
___8.2.1배치처리개념및특징
___8.2.2배치스케줄러소개및비교
___8.2.3배치워크플로설계및구현
___8.2.4배치처리최적화
8.3실시간처리
___8.3.1실시간처리개념및특징
___8.3.2스트리밍플랫폼소개및비교
___8.3.3실시간데이터파이프라인설계및구축
___8.3.4실시간처리최적화
8.4배치처리vs실시간처리
___8.4.1배치처리와실시간처리의핵심차이점
___8.4.2시스템요구사항기반처리방식선택가이드
___8.4.3하이브리드아키텍처

[PART03]시스템아키텍처설계

▣9장:로그설계와운영
9.1로그수집,저장,분석및시각화
___9.1.1로그의역할
___9.1.2로그유형
___9.1.3로그수집방법및도구
___9.1.4효율적인로그저장전략
9.2로그형식및관리전략
___9.2.1로그형식표준화의중요성
___9.2.2로그형식종류및선택기준
___9.2.3로그레벨정의및활용
___9.2.4로그메시지작성가이드라인
9.3ElasticStack
___9.3.1ElasticStack이란?
___9.3.2Elasticsearch
___9.3.3Logstash
___9.3.4Kibana
___9.3.5Beats
9.4A/B테스트및실험디자인
___9.4.1A/B테스트란?
___9.4.2실험설계원칙
___9.4.3통계적유의성검증및결과해석
___9.4.4A/B테스트수행절차및도구

▣10장:시스템아키텍처
10.1시스템아키텍처설계시고려사항
___10.1.1비기능적요구사항분석방법
___10.1.2설계제약조건식별및관리
___10.1.3아키텍처패턴소개
10.2모놀리식vs마이크로서비스
___10.2.1모놀리식아키텍처
___10.2.2마이크로서비스아키텍처
___10.2.3모놀리식과마이크로서비스아키텍처비교분석
___10.2.4마이크로서비스로의전환전략
10.3분산시스템설계원칙
___10.3.1분산시스템트레이드오프이해
___10.3.2분산시스템설계시고려사항
___10.3.3분산시스템장애허용설계
10.4병목현상식별및해결전략
___10.4.1성능병목지점식별방법론
___10.4.2병목현상유형
___10.4.3시스템성능측정및분석도구
___10.4.4병목현상해결전략

▣11장:시스템최적화및확장
11.1로드밸런싱
___11.1.1로드밸런싱의필요성과종류
___11.1.2로드밸런싱알고리즘
___11.1.3로드밸런서도입시고려사항
___11.1.4클라우드환경에서의로드밸런서
11.2캐싱
___11.2.1캐싱의기본원리및효과
___11.2.2캐싱전략
___11.2.3캐시데이터일관성유지방법
11.3컨테이너오케스트레이션
___11.3.1Docker컨테이너개념
___11.3.2컨테이너이미지빌드및관리
___11.3.3Kubernetes를이용한컨테이너오케스트레이션
___11.3.4클라우드기반컨테이너서비스소개
11.4오토스케일링
___11.4.1수평적확장vs수직적확장
___11.4.2오토스케일링정책및규칙설정
___11.4.3오토스케일링시고려사항
11.5성능측정및분석방법
___11.5.1성능측정지표선택
___11.5.2성능분석도구활용
___11.5.3병목지점식별및개선전략
___11.5.4성능테스트환경구축및시나리오설계

▣12장:대규모언어모델시스템구성
12.1검색컴포넌트선정및구성
___12.1.1검색기반LLM개요
___12.1.2벡터검색과키워드검색비교
___12.1.3검색도구비교
___12.1.4검색성능최적화및확장전략
12.2생성컴포넌트선정및구성
___12.2.1생성모델의종류및특성비교
___12.2.2GPT,LLaMA,Claude등주요LLM비교
___12.2.3생성모델선택기준
___12.2.4LLM최적화전략
12.3LLM시스템아키텍처구성전략
___12.3.1프롬프트ㆍ컨텍스트ㆍ미세조정비교
___12.3.2단일모델vs다중모델조합설계
___12.3.3LLM기반애플리케이션의API설계원칙
___12.3.4모델컨텍스트프로토콜(