|
Buffer는 N개의 크기를 갖고 있다가, Buffer가 꽉 차면 일부 Data를 새로운 Sample로 대체하는 방식을 갖게 된다. 신경망의 주요 목표는 target과 prediction의 격차를 줄이는 것이다. (이하 생략) - Cartpole environment
- DQN algorithm & code
- A2C algorithm & code
|
- 페이지 16페이지
- 가격 1,500원
- 등록일 2024.04.06
- 파일종류 아크로벳(pdf)
- 참고문헌 없음
- 최근 2주 판매 이력 없음
|
|
반듀라의 사회학습이론 행동주의 상호결정모형 관찰학습 대리강화 사회학습 사회학습이론 반듀라의사회학습이론
2. 행동주의 vs Bandura's 사회학습이론
- 행동주의적 학습: 반응-강화-학습
- 문제점:
자연적 상황에서의 학습 설명 X
새
|
- 페이지 9페이지
- 가격 2,500원
- 등록일 2019.06.24
- 파일종류 피피티(ppt)
- 참고문헌 있음
- 최근 2주 판매 이력 없음
|
|
강화요인을 적용하는 방법이다. 높은 생산성을 촉진하기 위하여 경영자는 일정 생산수준까지는 낮은 임률을 적용하고, 일정 수준 이상일 경우 높은 임률을 적용하는 것이다.
이상과 같은 강화 방법은 학습성격과 환경에 따라 그 효과성이 다
|
- 페이지 6페이지
- 가격 2,300원
- 등록일 2014.07.03
- 파일종류 한글(hwp)
- 참고문헌 없음
- 최근 2주 판매 이력 없음
|
|
학습의 전개
3. 수업 개선과 집단 탐구 학습의 실제
Ⅳ. 수학과(교육, 수업) 코너학습지도
1. 개념
2. 적용
3. 방법
1) 코너의 구성
2) 코너 학습의 운영
3) 교사의 역할
4. 유의점
Ⅴ. 수학과(교육, 수업) 개념강화학습지도
1. 개념 강화 학
|
- 페이지 16페이지
- 가격 6,500원
- 등록일 2011.03.19
- 파일종류 한글(hwp)
- 참고문헌 있음
- 최근 2주 판매 이력 없음
|
|
것으로 예상되므로 이 사례를 선정하였다. 자율 주행은 기업에서 강화학습을 사용하는 대표적 사례 중 하나이며, 자율 주행 차량은 주변환경과 상호 작용하고 행동에 따른 보상 혹은 페널티의 형태로 피드백을 받으면서 안전하고 효율적으로
|
- 페이지 4페이지
- 가격 2,400원
- 등록일 2024.07.16
- 파일종류 한글(hwp)
- 참고문헌 없음
- 최근 2주 판매 이력 없음
|