Beijing Institute of Technology · CN
Meistzitierte Publikationen im Bereich Gesundheit & MedTech
SR-GRPO: Stable Rank as an Intrinsic Geometric Reward for Large Language Model Alignment
2025 · 0 Zit. · ArXiv.org