ÍslenskaenEnglish

Aðilar að Skemmunni

Leit eftir:


LokaverkefniHáskólinn í Reykjavík>Tölvunarfræðideild>Meistaraprófsritgerðir>

Vinsamlegast notið þetta auðkenni þegar þið vitnið til verksins eða tengið í það: http://hdl.handle.net/1946/7485

Titill
en

Experiments with automatic weight tuning in heuristic evaluation functions

Útgáfa
Janúar 2007
Útdrættir
  • en

    Tuning weights coefficients in Heuristic Evaluation Function is a non-trivial task, often done by hand by game-playing program developers. The time and effort required to achieve good results has recently driven developers to utilize Reinforcement Learning techniques to tune these weight coefficients automatically. In this masters project, we have developed an general framework for automatic weight tuning. Secondly, we used the framework to conduct a comparisons study between the two main methods of learning from game data, TD(_) and TD-Leaf(_). A world-class chess program called Fruit was modified to enable learning within the framework, and then used to perform the experiments. The results from the study are interesting, as they show that although TD-Leaf(_) is generally believed to be superior and is indeed more robust in respect to different parameter settings, TD(_) can be just as effective when given proper parameter settings.

  • Þetta verkefnið snérist um að læra betri vigtir fyrir matsföll (e. Heuristic Evaluation Functions), sem notuð eru í forritum sem spila borðleiki eins og t.d. skák, en til þess var notað skilyrt viðbragð (e. Reinforcement Learning). Verkefnið var tvíþætt; annars vegar að búa til almennt forritasafn til að auðvelda ferlið og umstangið í kringum það að læra vigtir fyrir matsföll. Hinsvegar var forritasafn þetta svo notað til að læra vigtir fyrir mjög sterkt skákforrit sem heitir Fruit-Chess með tveimur mismunandi lærdóms aðferðum sem eru nefndar TD(_) og TD-Leaf(_). Lýsingu á hönnun forritasafnsins er að finna í þessari skýrslu eftir að lesendum hefur verið kynnt nauðsynlegt bakgrunnsefni. Niðurstöður tilrauna og samanburð milli aðferðanna er svo að finna í niðurstöðukafla þessarar skýrslu.

Athugasemdir

Tölvunarfræði, Project report

Birting
1.2.2011


Skrár
NafnRaðanlegtStærðRaðanlegtAðgangurRaðanlegtLýsingRaðanlegtSkráartegund
MSc_Jonas-Tryggvi-... .pdf1,35MBOpinn Heildartexti PDF Skoða/Opna