Ronald Ortner

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Csaba Szepesvari
116 publications
Remi Munos
89 publications
Alessandro Lazaric
66 publications
Matteo Pirotta
41 publications
Daniil Ryabko
16 publications
Pratik Gajane
14 publications
Peter Auer
9 publications
Ronan Fruit
6 publications
Adrienne Tuynman
1 publication

research

∙ 02/02/2022

Transfer in Reinforcement Learning via Regret Bounds for Learning Agents

We present an approach for the quantification of the usefulness of trans...

0 Adrienne Tuynman, et al. ∙

research

∙ 10/18/2019

Autonomous exploration for navigating in non-stationary CMPs

We consider a setting in which the objective is to learn to navigate in ...

10 Pratik Gajane, et al. ∙

research

∙ 05/14/2019

Variational Regret Bounds for Reinforcement Learning

We consider undiscounted reinforcement learning in Markov decision proce...

0 Pratik Gajane, et al. ∙

research

∙ 08/06/2018

Regret Bounds for Reinforcement Learning via Markov Chain Concentration

We give a simple optimistic algorithm for which it is easy to derive reg...

0 Ronald Ortner, et al. ∙

research

∙ 05/25/2018

A Sliding-Window Algorithm for Markov Decision Processes with Arbitrarily Changing Rewards and Transitions

We consider reinforcement learning in changing Markov Decision Processes...

0 Pratik Gajane, et al. ∙

research

∙ 02/12/2018

Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning

We introduce SCAL, an algorithm designed to perform efficient exploratio...

0 Ronan Fruit, et al. ∙

research

∙ 09/12/2012

Regret Bounds for Restless Markov Bandits

We consider the restless Markov bandit problem, in which the state of ea...

0 Ronald Ortner, et al. ∙

Success!

An error occurred

Ronald Ortner

Featured Co-authors

Transfer in Reinforcement Learning via Regret Bounds for Learning Agents

Autonomous exploration for navigating in non-stationary CMPs

Variational Regret Bounds for Reinforcement Learning

Regret Bounds for Reinforcement Learning via Markov Chain Concentration

A Sliding-Window Algorithm for Markov Decision Processes with Arbitrarily Changing Rewards and Transitions

Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning

Regret Bounds for Restless Markov Bandits

Sign in with Google

Consider DeepAI Pro