Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.
Analyzing AI Evaluation Benchmarks Through Information Retrieval and Network Science
0
Zitationen
5
Autoren
2025
Jahr
Abstract
Results for the ECIR 2026 paper “Analyzing AI Evaluation Benchmarks Through Information Retrieval and Network Science”. HITS-based bipartite graph analysis of LLM QA benchmarks to assess benchmark bias and leaderboard robustness.
Ähnliche Arbeiten
Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization
2017 · 20.373 Zit.
Generative Adversarial Nets
2023 · 19.841 Zit.
Visualizing and Understanding Convolutional Networks
2014 · 15.244 Zit.
"Why Should I Trust You?"
2016 · 14.259 Zit.
On a Method to Measure Supervised Multiclass Model’s Interpretability: Application to Degradation Diagnosis (Short Paper)
2024 · 13.125 Zit.