24Juni
2026

15:15 - 16:15

Vortragende: Stefan Huber (Head of Research Department IT)
Datum & Uhrzeit: Mittwoch, 24.06..2026, 15:15- 16:15 Uhr
Ort: FH Salzburg, Campus Urstein, HS 154, Urstein Süd 1, 5412 Puch / Salzburg

Abstract: Reinforcement Learning (RL) is one of the powerhouses in machine learning for all sorts of sequential decision making problems, from robot control to tuning large language models. At the same time, we face significant challenges in real-world application (e.g., sample efficiency, interpretability) and significant gaps in theory (e.g., lack of optimal solutions to standard benchmarks). In this talk, we first solve the Mountain Car problem to optimality, closing a gap after 36 years, with two interesting insights: The optimal strategy is very simple, yet the best MLP-based agents perform far from optimality. This motivated us to re-consider the mathematical architecture of RL agents, motivating a couple of first principles, and devise a new policy space based on a multi-variate generalization of Chebyshev policies. It turns out that our Chebyshev policies significantly improve upon every neural policy on every task we evaluated, while using two orders of magnitude less parameters, improving sample efficiency, interpretability, and more. We filed a patent with ABB/B&R based on this work concerning energy-optimized servo control. This work will be presented as an oral contribution at ICML 2026.

Teilnahme kostenlos. Anmeldung erbeten.

Die IT-Talks wenden sich an Studierende gleichermaßen wie an Interessent*innen an der Forschungsarbeit des Departments.

iCal

Name	Zweck	Ablauf	Typ	Anbieter
_meta_pixel	Registriert eine eindeutige ID, die den Nutzer identifiziert und wiedererkennt.	3 Monate	HTML	Meta
linkedin_insight_tag	Registriert eine eindeutige ID, die den Nutzer identifiziert und wiedererkennt. Wird für gezielte Werbung verwendet.	Sitzung	HTML	LinkedIn
_rdt_uuid	Registriert eine eindeutige ID, die den Nutzer identifiziert und wiedererkennt.	3 Monate	HTML	Reddit

Name	Zweck	Ablauf	Typ	Anbieter
_ga	Wird verwendet, um Benutzer zu unterscheiden.	2 Jahre	HTML	Google
_gid	Wird verwendet, um Benutzer zu unterscheiden.	1 Tag	HTML	Google
_dc_gtm_UA-7497985-1	Wird von DoubleClick (Google Tag Manager) verwendet, um die Besucher nach Alter, Geschlecht oder Interessen zu identifizieren.	2 Jahre	HTML	Google
_gali	Wird von Google Analytics verwendet, um Klicks auf verschiedene Links mit gleichem Linkziel zu erkennen.	1 Minute	HTML	Google

IT-Talk: Chebyshev Policies for Low-Dimensional Reinforcement Learning

Standorte

Campus Urstein/ Wissenspark

Campus Kuchl

Campus Salzburg (Uniklinikum LKH)

Campus Schwarzach (Kardinal Schwarzenberg Klinikum)

Newsletter

Folgen Sie uns

Quicklinks