Asaf Cassel

research

∙ 03/02/2023

Efficient Rate Optimal Regret for Adversarial Contextual MDPs Using Online Function Approximation

We present the OMG-CMDP! algorithm for regret minimization in adversaria...

0 Orin Levy, et al. ∙

research

∙ 11/27/2022

Counterfactual Optimism: Rate Optimal Regret for Stochastic Contextual MDPs

We present the UC^3RL algorithm for regret minimization in Stochastic Co...

0 Orin Levy, et al. ∙

research

∙ 06/03/2022

Rate-Optimal Online Convex Optimization in Adaptive Linear Control

We consider the problem of controlling an unknown linear dynamical syste...

8 Asaf Cassel, et al. ∙

research

∙ 03/02/2022

Efficient Online Linear Control with Stochastic Convex Costs and Unknown Dynamics

We consider the problem of controlling an unknown linear dynamical syste...

3 Asaf Cassel, et al. ∙

research

∙ 02/25/2021

Online Policy Gradient for Model Free Learning of Linear Quadratic Regulators with √(T) Regret

We consider the task of learning to control a linear dynamical system un...

0 Asaf Cassel, et al. ∙

research

∙ 07/26/2020

The Pendulum Arrangement: Maximizing the Escape Time of Heterogeneous Random Walks

We identify a fundamental phenomenon of heterogeneous one dimensional ra...

0 Asaf Cassel, et al. ∙

research

∙ 07/01/2020

Bandit Linear Control

We consider the problem of controlling a known linear dynamical system u...

0 Asaf Cassel, et al. ∙

research

∙ 02/19/2020

Logarithmic Regret for Learning Linear Quadratic Regulators Efficiently

We consider the problem of learning in Linear Quadratic Control systems ...

4 Asaf Cassel, et al. ∙

research

∙ 06/04/2018

A General Approach to Multi-Armed Bandits Under Risk Criteria

Different risk-related criteria have received recent interest in learnin...

0 Asaf Cassel, et al. ∙

Asaf Cassel

Featured Co-authors

Sign in with Google

Consider DeepAI Pro