OpenAlex · Aktualisierung stündlich · Letzte Aktualisierung: 26.03.2026, 00:45

Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards

2025·0 Zitationen·Lecture notes in computer science

Volltext beim Verlag öffnen

0

Zitationen

4

Autoren

2025

Jahr

Abstract

Für dieses Paper ist kein Abstract in der Datenbank hinterlegt.

Abstract beim Verlag einsehen

Ähnliche Arbeiten

Adam: A Method for Stochastic Optimization

2014 · 84.464 Zit.

A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting

1997 · 19.938 Zit.

No free lunch theorems for optimization

1997 · 13.670 Zit.

Diagnosing Non-Intermittent Anomalies in Reinforcement Learning Policy Executions (Short Paper)

2017 · 11.248 Zit.

Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions

2005 · 10.137 Zit.

Autoren

Institutionen

Themen

Advanced Bandit Algorithms ResearchArtificial Intelligence in Healthcare and Education

Volltext beim Verlag öffnen