'Two-ply game tree' 태그의 글 목록

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록Two-ply game tree (1)

체인의정석

강화학습 알고리즘 (Two-ply game tree , Alpha-Beta purning, Monte Carlo Tree Search)

오늘은 알파고에서 사용된 것 처럼 게임을 진행하면서 스스로 학습하는 알고리즘인 강화학습 알고리즘에 대한 수업을 듣고 정리해 보았다. 1. Two-ply game tree Two-ply game tree의 경우 2개의 플레이어가 있다고 생각하고 선택을 한다. 만약 순서대로 한번씩 선택을 하는 경우에는 내가 최선책을 선택하고 나면 다른 플레이어가 해당 시점에서의 최선책을 선택하게 된다. 이에 따라서 내 시점에서 최선의 선택이 아닌 상대가 상대입장에서 최선의 선택을 한 이후에 해당 시점에서의 최선의 선택을 하는것이 Two-ply 게임 트리이다. 여기서 MiniMax-search 를 사용하게 되는데 이는 내 입장 그리고 상대입장을 고려하여 상대방의 최적의 페이스를 고려하고 내 시점에서 최선이 아닌 차선 중 최선..

빅데이터&인공지능/인공지능 2023. 10. 7. 11:13

이전 Prev 1 Next 다음

목록Two-ply game tree (1)

체인의정석

티스토리툴바