OpenAlex · Aktualisierung stündlich · Letzte Aktualisierung: 15.03.2026, 15:19

Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Evaluating accuracy and reproducibility of large language model performance on critical care assessments in pharmacy education

2025·13 Zitationen·Frontiers in Artificial IntelligenceOpen Access
Volltext beim Verlag öffnen

13

Zitationen

8

Autoren

2025

Jahr

Abstract

ChatGPT-4 was the most accurate LLM on critical care pharmacy questions and few-shot CoT improved accuracy the most. Average student accuracy was similar to LLMs overall, and higher on knowledge application questions. These findings support the need for future assessment of customized training for the type of output needed. Reliance on LLMs is only supported with recall-based questions.

Ähnliche Arbeiten