OpenAlex · Aktualisierung stündlich · Letzte Aktualisierung: 14.03.2026, 01:43

Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Assessing accuracy and legitimacy of multimodal large language models on Japan Diagnostic Radiology Board Examination

2025·4 Zitationen·Japanese Journal of RadiologyOpen Access
Volltext beim Verlag öffnen

4

Zitationen

10

Autoren

2025

Jahr

Abstract

Recent multimodal LLMs, particularly o3 and Gemini 2.5 Pro, have demonstrated remarkable progress on JDRBE questions, reflecting their rapid evolution in diagnostic radiology. Eight multimodal large language models were evaluated on the Japan Diagnostic Radiology Board Examination. OpenAI's o3 and Google DeepMind's Gemini 2.5 Pro achieved high accuracy rates (72% and 70%) and received good legitimacy scores from human raters, demonstrating steady progress.

Ähnliche Arbeiten