Opponent Modeling

From PRLT
Jump to: navigation, search

Contents

Outline

Student: Mario Lozza

Agenda

Ottobre 2006

--Usrlozza 14:17, 7 October 2006 (CEST)

  • Addattamento modeler a trial-based update

Settembre 2006

--Usrlozza 14:17, 7 October 2006 (CEST)

  • Esperimenti Q-Learning full information vs fixed policy
  • Esperimenti Q-Learning full information vs Q-Learning

Estate 2006

--Usrlozza 14:17, 7 October 2006 (CEST)

  • Implementazione ambiente poker offline
  • Esperimenti Q-Learning vs fixed policy
  • Esperimenti Q-Learning vs Q-Learning
  • Esperimenti fixed policy vs fixed policy

Lavori Precedenti

--Usrlozza 14:17, 7 October 2006 (CEST)

  • Implementazione giocatore poker online
  • Implementazione server poker online
  • Implementazione ambiente poker online
  • Implementazione logger manager
  • Migrazione da DTD a XSD
  • Lettura stato dell'arte