OpenAlex · Aktualisierung stündlich · Letzte Aktualisierung: 15.03.2026, 05:13

Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Application of unified health large language model evaluation framework to In-Basket message replies: bridging qualitative and quantitative assessments

2025·6 Zitationen·Journal of the American Medical Informatics AssociationOpen Access
Volltext beim Verlag öffnen

6

Zitationen

14

Autoren

2025

Jahr

Abstract

Our unified evaluation framework bridges the gap between qualitative human assessments and automated quantitative metrics, enhancing the reliability and scalability of LLM evaluations in healthcare. While automated quantitative evaluations are not ready to fully replace qualitative human evaluations, they can be used to enhance the process and, with relevant benchmarks derived from the unified framework proposed here, they can be applied to LLM monitoring and evaluation of updated versions of the original technology evaluated using qualitative human standards.

Ähnliche Arbeiten