Proceedings of Machine Learning Research

Jekyll2023-02-08T10:39:08+00:00https://proceedings.mlr.press/v24/feed.xmlProceedings of Machine Learning ResearchProceedings of the Tenth European Workshop on Reinforcement Learning Held in Edinburgh, Scotland on 30 June to 01 July 2012 Published as Volume 24 by the Proceedings of Machine Learning Research on 12 January 2013. Volume Edited by: Marc Peter Deisenroth Csaba Szepesvári Jan Peters Series Editors: Neil D. Lawrence PMLRLearning Exploration/Exploitation Strategies for Single Trajectory Reinforcement Learning2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/castronovo12a[{"given"=>"Michael", "family"=>"Castronovo"}, {"given"=>"Francis", "family"=>"Maes"}, {"given"=>"Raphael", "family"=>"Fonteneau"}, {"given"=>"Damien", "family"=>"Ernst"}]

Feature Reinforcement Learning using Looping Suffix Trees2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/daswani12a[{"given"=>"Mayank", "family"=>"Daswani"}, {"given"=>"Peter", "family"=>"Sunehag"}, {"given"=>"Marcus", "family"=>"Hutter"}]

Preface2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/deisenroth12a[{"given"=>"Marc Peter", "family"=>"Deisenroth"}, {"given"=>"Csaba", "family"=>"Szepesvári"}, {"given"=>"Jan", "family"=>"Peters"}]

Planning in Reward-Rich Domains via PAC Bandits2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/goschin12a[{"given"=>"Sergiu", "family"=>"Goschin"}, {"given"=>"Ari", "family"=>"Weinstein"}, {"given"=>"Michael L.", "family"=>"Littman"}, {"given"=>"Erick", "family"=>"Chastain"}]

Actor-Critic Reinforcement Learning with Energy-Based Policies2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/heess12a[{"given"=>"Nicolas", "family"=>"Heess"}, {"given"=>"David", "family"=>"Silver"}, {"given"=>"Yee Whye", "family"=>"Teh"}]

Directed Exploration in Reinforcement Learning with Transferred Knowledge2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/mann12a[{"given"=>"Timothy A.", "family"=>"Mann"}, {"given"=>"Yoonsuck", "family"=>"Choe"}]

Online Skill Discovery using Graph-based Clustering2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/metzen12a[{"given"=>"Jan Hendrik", "family"=>"Metzen"}]

An Empirical Analysis of Off-policy Learning in Discrete MDPs2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/paduraru12a[{"given"=>"Cosmin", "family"=>"Păduraru"}, {"given"=>"Doina", "family"=>"Precup"}, {"given"=>"Joelle", "family"=>"Pineau"}, {"given"=>"Gheorghe", "family"=>"Comănici"}]

Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/seldin12a[{"given"=>"Yevgeny", "family"=>"Seldin"}, {"given"=>"Csaba", "family"=>"Szepesvári"}, {"given"=>"Peter", "family"=>"Auer"}, {"given"=>"Yasin", "family"=>"Abbasi-Yadkori"}]

Gradient Temporal Difference Networks2013-01-12T00:00:00+00:002013-01-12T00:00:00+00:00https://proceedings.mlr.press/v24/silver12a[{"given"=>"David", "family"=>"Silver"}]