Journées SDA2 2018 : Systèmes Dynamiques, Automates & Algorithmes

4-6 juil. 2018 Saint-Etienne (France)

sciencesconf.org:sda2-2018:207933

Je discuterai une méthode d'apprentissage d'apprentissage par renforcement ou d'urne aléatoire pour résoudre le problème suivant. Étant donné un jeu de type pierre/feuille/ciseaux, comment déterminer la stratégie gagnante. Une méthode où l'apprentissage est fait sur la base de deux comparaisons converge presque surement tandis qu'une méthode plus simple utilisant une seule comparaison ne converge pas toujours.

Type :	:	exposé invité
Thématiques	:	Exposés SDA2
PDF version	:	PDF version

Personnes connectées : 1