일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 스마트컨트렉트 함수이름 중복 호출
- ethers typescript
- ethers type
- multicall
- 러스트기초
- vue기초
- 스마트컨트렉트테스트
- 컨트렉트 동일한 함수이름 호출
- 스마트컨트렉트프록시
- 스마트 컨트렉트 함수이름 중복
- ambiguous function description
- 스마트컨트렉트 예약어 함수이름 중복
- nest.js설명
- 프록시배포구조
- ethers
- SBT표준
- ethers websocket
- 컨트렉트 배포 자동화
- 티스토리챌린지
- 러스트 기초 학습
- 러스트 기초
- 머신러닝기초
- ethers v6
- 오블완
- Vue
- chainlink 설명
- rust 기초
- Vue.js
- git rebase
- 체인의정석
Archives
- Today
- Total
목록Two-ply game tree (1)
체인의정석
강화학습 알고리즘 (Two-ply game tree , Alpha-Beta purning, Monte Carlo Tree Search)
오늘은 알파고에서 사용된 것 처럼 게임을 진행하면서 스스로 학습하는 알고리즘인 강화학습 알고리즘에 대한 수업을 듣고 정리해 보았다. 1. Two-ply game tree Two-ply game tree의 경우 2개의 플레이어가 있다고 생각하고 선택을 한다. 만약 순서대로 한번씩 선택을 하는 경우에는 내가 최선책을 선택하고 나면 다른 플레이어가 해당 시점에서의 최선책을 선택하게 된다. 이에 따라서 내 시점에서 최선의 선택이 아닌 상대가 상대입장에서 최선의 선택을 한 이후에 해당 시점에서의 최선의 선택을 하는것이 Two-ply 게임 트리이다. 여기서 MiniMax-search 를 사용하게 되는데 이는 내 입장 그리고 상대입장을 고려하여 상대방의 최적의 페이스를 고려하고 내 시점에서 최선이 아닌 차선 중 최선..
빅데이터&인공지능/인공지능
2023. 10. 7. 11:13