is Íslenska en English

Lokaverkefni (Bakkalár)

Háskólinn í Reykjavík > Tæknisvið / School of Technology > BSc Tölvunarfræðideild / Department of Computer Science >

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/33574

Titill: 
  • Titill er á ensku Using SARSA with function approximation to create policies for MCTS
Námsstig: 
  • Bakkalár
Leiðbeinandi: 
Útdráttur: 
  • Útdráttur er á ensku

    This paper proposes CARL, a pair of agents that apply reinforcement learning and function approximation using regression to learn policies for games where human heuristics cannot be applied. The purpose of these policies is to do search control in Monte Carlo Tree Search (MCTS), a heuristic search algorithm to see if the learned policies can outperform upper confidence bound for trees (UCT).

Samþykkt: 
  • 12.6.2019
URI: 
  • http://hdl.handle.net/1946/33574


Skrár
Skráarnafn Stærð AðgangurLýsingSkráartegund 
CarlAgent.pdf776.96 kBOpinnHeildartextiPDFSkoða/Opna