Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards
2025·0 Zitationen·Lecture notes in computer science
Volltext beim Verlag öffnen0
Zitationen
4
Autoren
2025
Jahr
Abstract
Für dieses Paper ist kein Abstract in der Datenbank hinterlegt.
Abstract beim Verlag einsehenÄhnliche Arbeiten
Adam: A Method for Stochastic Optimization
2014 · 84.464 Zit.
A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting
1997 · 19.938 Zit.
No free lunch theorems for optimization
1997 · 13.670 Zit.
Diagnosing Non-Intermittent Anomalies in Reinforcement Learning Policy Executions (Short Paper)
2017 · 11.248 Zit.
Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions
2005 · 10.137 Zit.
Autoren
Institutionen
Themen
Advanced Bandit Algorithms ResearchArtificial Intelligence in Healthcare and Education