|
Buffer는 N개의 크기를 갖고 있다가, Buffer가 꽉 차면 일부 Data를 새로운 Sample로 대체하는 방식을 갖게 된다. 신경망의 주요 목표는 target과 prediction의 격차를 줄이는 것이다. (이하 생략) - Cartpole environment
- DQN algorithm & code
- A2C algorithm & code
|
- 페이지 16페이지
- 가격 1,500원
- 등록일 2024.04.06
- 파일종류 아크로벳(pdf)
- 참고문헌 없음
- 최근 2주 판매 이력 없음
|