강화학습 이론&실습 (기초 수학부터 강화학습 알고리즘까지)

강화학습 이론&실습 (기초 수학부터 강화학습 알고리즘까지)

$30.70
Description
*충실한 이론 배경과 간결한 파이썬 코드를 활용하여 어렵게만 느껴지는 인공지능 강화학습 알고리즘을 내 도구로 만드는 길잡이.*
ChatGPT로 다시금 떠오른 화두인 인공지능 알고리즘 중 강화학습을 배우는 데 초점을 둔 책입니다. 인공지능은 논문과 전공책으로 무작정 공부하기에 다양한 배경 지식이 요구되어 도전하기 어려운 분야입니다. 본 책은 강화학습을 배우기 위해 필요한 사전 지식들을 최대한 쉽고 자세하게 정리하여 초심자들이 느끼는 진입 장벽을 최대한 낮춤과 동시에, 다양한 예제와 기본이 되는 알고리즘을 상세하게 설명하여 책을 읽고 난 뒤 강화학습을 연구하는 데 도움이 될 수 있도록 하였습니다. 또한 예제들을 실제로 해결해보면 인공지능이 스스로 사람이 설정한 목표로 문제를 해결하는 동영상들을 확인할 수 있으므로 독자 여러분은 살아있는 공부를 경험하게 되어 어렵게만 느껴졌던 이론을 재미있게 학습하실수 있을 것입니다.
저자

황현석

부산대학교에서자연과학을공부하고서울대학교에서계산과학분야로전공을바꾸어공학석사학위를취득했다.공식교과과정에서편미분방정식을푸는방식을배울때대학원시절동안옆자리에앉았던동기가인공지능을공부하는것을보고따라서머신러닝을조금씩독학하기시작했다.머신러닝분야중게임을스스로플레이하는인공지능을보고강화학습에가장큰흥미를느낀뒤취미삼아이론을공부하고개념을구현하는데시간을많이보냈다.어쩌다보니현재인공지능알고리즘을적용하는반도체모델링을타겟으로하는회사에서인공지능을전자회로시뮬레이터에접목하는업무를맡고있다.

목차

프롤로그
1.환경설정

1.1윈도우버전

1.2리눅스버전

2.강화학습을위한사전지식

2.1머신러닝과강화학습
2.1.1머신러닝
2.1.2강화학습

2.2기초수학
2.2.1기초선형대수
2.2.2기초미분과적분
2.2.3기초확률통계

2.3최적화
2.3.1뉴턴-랩슨법(Newton-Raphsonmethod)
2.3.2경사하강법(Gradientdescentmethod)

2.4목적함수
2.4.1최소제곱
2.4.2확률엔트로피와쿨백-라이블러발산

2.5인공신경망
2.5.1신호전·후처리
2.5.2순방향전파
2.5.3역방향전파

2.6초간단파이토치튜토리얼
2.6.1MNIST
2.6.2회귀분석

2.7매개변수탐색법
2.7.1격자탐색법(Gridsearch)
2.7.2베이지안탐색법(Bayesianoptimization)

3.마르코프의사결정과동적계획법풀이전략

3.1마르코프의사결정

3.2동적계획법

3.3[실습]잭의렌터카업체운영전략-동적계획법을이용한마르코프의사결정

4.밸만방정식부터강화학습까지

4.1몬테-카를로추정법

4.2시간차학습
4.2.1TD(0)
4.2.2TD(λ)

4.3Monte-CarlovsTemporalDifference

4.4에이전트학습
4.4.1SARSA
4.4.2Q-learning
4.4.3실습

5.Q-함수는신경망에맡긴다-DQN

5.1DQN208
5.1.1이론209
5.1.2실습219
5.2파생알고리즘256
5.2.1DDQN256
5.2.2PER260

6.즉각적인학습이필요할때-Policygradient

6.1Actor-Critic
6.1.1이론
6.1.2실습

6.2파생알고리즘
6.2.1AsynchronousAdvantageActor-Critic
6.2.2LSTM-BasedAdvantageActor-Critic
6.2.3[고급]TrustRegionPolicyOptimization
6.2.4[고급]ProximalPolicyOptimization

7.탐험의전략-Modelbasedlearning

7.1사전지식-밴딧모델

7.2이론-Monte-CarloTreeSearch

7.3실습
7.3.1CartPole
7.3.2Tic-Tac-Toe

찾아보기

출판사 서평

“데이터분석에의존한머신러닝은이제그만!”

『강화학습이론&실습』이책은아직도인공지능이적용되지못한산업에서기술을적용할가능성을제안하는도서이다.이책이면인간보다주어진환경에더잘적응하는인공지능의개념을공부하여나만의인공지능을만드는기술에대해서배울수있다.