Function Approximation with Bounds

From PRLT
Jump to: navigation, search

Contents

Outline

Student: Francesco Recchia and Guglielmo Roelfsema

Agenda

bib file (zipped):File:Recchia-roelfsema.zip

Dicembre 2006

--letoatreides 09:15, 26 October 2006 (CEST)

  • Implementazione di bound approssimati (epsilon-bound) e bound con distribuzione

Novembre 2006

--letoatreides 09:15, 26 October 2006 (CEST)

  • Implementazione di one-step bounds su rappresentazione singola sia in learning sia con DP
  • Passaggio a rappresentazione multipla
  • Analizzare la possibilità di generare macroazioni (da intendere come l'aggregazione di due azioni) per evitare l'effetto delle azioni indifferenti
  • Valutare possibili metodi di riaggregazione

Ottobre 2006

  • tester for checking safe aggregates in paratrooper problem
  • Paratrooper environment -- Qtable 3d plot and analysis
  • Paratrooper environment implementation, Qlearning tests
  • Derailing train environment implementation, Qlearning tests
  • Ideazione nuovi environment di test per algoritmi bounded (Derailing Train Environment, Paratrooper Environment)
  • Major PRLT refactoring (classes xml, ...)

--Recchia 17:10, 12 October 2006 (CEST)

Settembre 2006

  • Lettura stato dell'arte
  • Problema della Briscola

--Recchia 17:00, 10 October 2006 (CEST)

Estate 2006

--letoatreides 10:17, 7 September 2006 (CEST)

  • Lettura stato dell'arte