Physical AI로 떠나는 강화학습 첫걸음 (2 판)

Physical AI로 떠나는 강화학습 첫걸음 (2 판)

$29.00
Description
이 책은 강화학습을 실제로 적용하려면 반드시 알아야 할 강화학습의 기초 이론에 관한 것입니다. 이 책의 목적은 Physical AI를 전문적으로 연구하시려는 분들에게 심화 연구를 위한 기초를 충실하게 다지게 하고, 실무 경험이 풍부한 분들에게는 체계적으로 이론이 정립되도록 하는 것입니다.

생각의 흐름을 시각적으로 표현하기 위해서, 각 생각의 요소를 단계별로 분류하고 연결하여 도식화하였습니다. 이는 여러분들이 논리를 추론하게 하는 것보다는 체험할 수 있도록 도와줄 것입니다. 그러므로 이 책은 그림책에 더 가깝습니다.

수학의 활용을 최소화하여 필수적인 수학만 사용하였습니다. 강화학습에서 사용하는 수학은 계산을 위한 것이기보다는 주로 상황을 표현하기 위한 수학입니다. 사실 이러한 수학이 더 어려울 수 있습니다. 특히 변수에 붙은 첨자들 때문에 처음 배우는 분들은 혼돈스러울 것입니다. 어렵고 혼란스러운 수학이 전개될 때마다 충실히 설명하고 명확하게 하여 초보자분들도 이론을 쉽게 이해할 수 있도록 하였습니다

예제들을 이론을 체험하도록 만들어서, 이 책을 공부하시는 분들이 이론을 이해를 넘어서 느끼도록 하였습니다.
저자

김원하

출간작으로『PhysicalAI로떠나는강화학습첫걸음』등이있다.

목차

CHAPTER1.강화학습둘러보기
1.1강화학습의목적
1.2강화학습의요소
1.3강화학습의순차적과정
1.4강화학습의학습방법차별성

CHAPTER2.강화학습모델링
2.1MDP환경모델링
2.2MDP의강화학습모델링
2.3강화학습문제분류
2.4요약및정리

CHAPTER3.Bellman방정식
3.1Bellman기대방정식
3.2Bellman최적방정식
3.3요약및정리

CHAPTER4.환경을알때강화학습:Planning
4.1Model기반강화학습
4.2반복적정책평가(IterativePolicyEvalution)
4.3정책반복(PolicyIteration)
4.4가치반복(ValueIteration)
4.5요약및정리

CHAPTER5.환경을모를때강화학습I:Prediction
5.1MonteCarlo(MC)방법
5.2MC기반에피소드학습
5.3Model-FreePrediction
5.4Prediction기법분석
5.5요약및정리

CHAPTER6.환경을모를때강화학습II:Control
6.1Action-value함수를활용한Learning
6.2Control
6.3Control알고리즘
6.4자율주행로봇의경로찾기
6.5PythonCode:Gridworld
6.5요약및정리

CHAPTER7.환경근사화
7.1환경근사화필요성
7.2환경근사화함수
7.3신경망(NeuralNetwork)

CHAPTER8.Value기반강화학습
8.1Agent분류
8.2ValueNetwork학습
8.3DeepQ-Network(DQN)
8.4PythonCode:Cartpole
8.5요약및정리

CHAPTER9.Policy기반강화학습
9.1Deterministicpolicy와stochasticpolicy
9.2PolicyNetwork학습
9.3Actor-Critic
9.4PythonCode구현:Cartpole
9.5요약및정리