벡터 데이터베이스 설계와 구축: Vector DBMS&RAG

벡터 데이터베이스 설계와 구축: Vector DBMS&RAG

$19.07
Description
최근 팔란티어와 같은 AI 소프트웨어 기업들이 국방 및 의료 분야에서 두각을 나타내고 있으며, 그 핵심에는 데이터 기반 설계와 고도화된 분석기법이 자리하고 있다. AI 시스템의 성능을 극대화하려면 비정형 데이터를 구조적으로 정의하고 효율적으로 활용하는 것이 필수적이며, 이를 뒷받침하는 핵심 기술로는 Vector DB, 지식그래프 모델링, 온톨로지 등이 있다. 특히, 비정형 데이터에서 의미적 유사도를 빠르게 검색할 수 있는 Vector DB와 관계 중심 탐색이 가능한 Graph DB는 AI 구현에 필수적인 요소이다.
우리나라가 AI 선진국과 경쟁하기 위해서는 AI 개발 역량을 넘어 데이터를 구조화하고 분석하는 능력을 키우는 것이 중요하며, 이 책은 Vector DB, Graph DB의 개념부터 실전 적용까지 데이터 중심의 AI 설계 핵심 가이드를 제공한다.
저자

송한림

데이터와AI의융합을선도하는데이터아키텍처및AI전문가로,20여년간금융,유통,공공등다양한산업에서데이터기반프로젝트를성공적으로수행하였습니다.은행,보험,카드,캐피탈,증권등금융권프로젝트부터홈쇼핑과e-Commerce같은유통분야,국방,경찰,검찰,인천공항등공공프로젝트까지폭넓은실무경험을쌓아왔으며,AI분야에서도역량을보유한저자는대기업에서AI와데이터아키텍처관련강사로도활발히활동하고있습니다.
저자는‘대한민국DA공모대전’입상경력과DAP(DataArchitectureProfessional)자격을통해데이터관리
분야에서인정받고있으며,이를기반으로AI와데이터융합기술의잠재력을널리알리는데힘쓰고있습니다.

목차

Chapter1.VectorDataBase개요
__1.1TheRisingStarofAI
__1.2Vector에대한이해

Chapter2.VectorDBMS종류및선택기준
__2.1VectorDBMS특징
__2.2VectorDBMS종류및선택시고려사항
__2.3VectorDBMS종류별특징비교

Chapter3.생성형AI프로젝트설계방법론
__3.1생성형AI프로젝트수행작업절차
__3.2데이터분석준비및설계절차

Chapter4.데이터분석및준비
__4.1데이터범위/유형분석
__4.2데이터요건분석
__4.3데이터피처분석
__4.4데이터셋확보

Chapter5.VectorDataBaseSchema설계
__5.1VectorDBSchema설계
__5.2CollectionDesign
__5.3VectorDesign
__5.4MetaDataDesign
__5.5RelationshipDesign

Chapter6.데이터검색/응답정합성검증(Retrieval/Response)
__6.1데이터평가및검증

Chapter7.RAG개요및성능개선
__7.1RAG개요
__7.2RAG아키텍처
__7.3RAG한계
__7.4RAG개선(AdvancedRAG,ModularRAG,GraphRAG)

Chapter8.AdvancedRAG
__8.1AdvancedRAG개요
__8.2원천데이터의정비
__8.3Retrieval전략의조정
__8.4Search전략조정
__8.5Collection분리/분산

Chapter9.ModularRAG
__9.1ModularRAG개요
__9.2독립모듈화
__9.3다양한FLOW패턴
__9.4참조-ModularRAG외부논문

Chapter10.GraphRAG-지식기반RAG
__10.1GraphRAG개요
__10.2GraphDB모델링-데이터모델링기본구조
__10.3GraphDB모델링-데이터의분리(Divide)깊이
__10.4GraphDB모델링-데이터모델링절차
__10.5GraphDB모델링-데이터검색
__10.6온톨로지
__10.7GraphRAG에서지식그래프활용(GraphDB+온톨로지)
__10.8GraphRAG의비즈니스적용사례(국방,의료,법률)
__10.9Neo4jDB

Chapter11.프로그램따라해보기
__11.1ChromaDB-VectorDB
____11.1.1ChromaDB설치
____11.1.2프로그램따라하기withPython-ChromaEmbedding데이터저장
____11.1.3프로그램따라하기withPython-Response정보openAI로생성하기
____11.1.4프로그램따라하기withPython-Chunking
____11.1.5프로그램따라하기withPython-샘플프로그램
__11.2Neo4jDB-GraphDB
____11.2.1Neo4jDB설치
____11.2.2프로그램따라하기withPython-Neo4jEmbedding데이터저장
____11.2.3프로그램따라하기withPython-Haluciation(환각)개선withNeo4j
__11.3Neo4JDB-알고리즘활용(커뮤니티생성)
____11.3.1Neo4JPlug-In설치
____11.3.2프로그램따라하기withPython-그래프모델생성(인터넷뉴스데이터)
____11.3.3프로그램따라하기with알고리즘-커뮤니티생성(인터넷뉴스데이터)
__11.4FAISS-Library
____11.4.1FAISS설치
____11.4.2프로그램따라하기withPython-FAISSEmbedding저장및검색
__11.5CHAT시스템-RAG환경
____11.5.1Streamlit
____11.5.2프로그램따라하기withPython-간단한CHAT프로그램

출판사 서평

어떤독자를위한책인가?
-.AI비정형데이터의분석/설계및데이터활용전략에관심이있는AI분석/설계자
-.VectorDB를기반으로한데이터모델링,최적화,응용방안을탐구하려는AI연구자및개발자
-.데이터분석관점에서GraphDB를활용한지식그래프구조화에관심있는독자


개념설명에만머물지않고
그너머,실전VectorDB에진입할수있는예제수록
*ChromaDB-VectorDB
*Neo4jDB-GraphDB
*Neo4jDB-알고리즘활용(커뮤니티생성)
*FAISS-Library
*CHAT시스템-RAG환경


*VectorDB는비정형데이터,특히벡터데이터를처리하는데최적화된데이터베이스다.VectorDB는벡터공간에서데이터를다루며,각데이터는고차원벡터로표현된다.다시말해,VectorDB는수학적계산을통해데이터를3차원이상의다차원공간에모델링한다.

*GraphDB는복잡한관계정보를바탕으로데이터를분석하고,보다정확한정보나문제에대한추론결과를제공할수있다.단순데이터검색뿐아니라,데이터간의연결성을이용한심층적인분석이가능하다.

*이책은VectorDB에대한개념이해부터차근차근설명해서마지막챕터에서는실전VectorDB및GraphDB까지진입하는것을목적으로한다.