Sort by:
파이토치로 완성하는 실전 강화학습 (REINFORCE, A2C, DQN, DDQN, PPO, A3C 이론과 구현을 한번에!)
$48.53
강화학습의 기초부터 고급 주제까지 단계적이고 체계적으로 다루는 책이다. 정책 기반 알고리즘(REINFORCE, PPO)과 액터-크리틱(A2C, A3C), 가치 기반(DQN, DDQN) 기법을 이론과 실습의 균형을 맞춰 설명하며, 개념을 시각화하고 수식을 단계별로 풀어 설명하는 한편...