Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.

Technische Grundlagen großer Sprachmodelle

2025·3 Zitationen·Die RadiologieOpen Access

Volltext beim Verlag öffnen

Zitationen

Autoren

2025

Jahr

Abstract

Zusammenfassung Hintergrund Große Sprachmodelle (Large Language Models, LLMs) wie ChatGPT haben die Art und Weise, wie Computer menschliche Sprache analysieren können und wie wir mit Computern interagieren können, in nur kurzer Zeit revolutioniert. Fragestellung Überblick über die Entstehung und die Grundprinzipien von computergestützten Sprachmodellen. Methoden Narrative literaturgestützte Beleuchtung der Entstehungsgeschichte von Sprachmodellen, der technischen Grundlagen, des Trainingsprozesses und der Limitationen großer Sprachmodelle. Ergebnisse Große Sprachmodelle basieren heutzutage meist auf Transformer-Modellen, die durch ihren Aufmerksamkeitsmechanismus Kontext erfassen können. Durch einen mehrstufigen Trainingsprozess mit umfassendem Vortraining, überwachtem Feintuning und Alignment mit menschlichen Präferenzen haben große Sprachmodelle ein generelles Sprachverständnis entwickelt. So sind sie in der Lage, flexibel Texte zu analysieren sowie mit hoher Qualität zu erzeugen. Schlussfolgerung Ihre technischen Grundlagen und ihr Trainingsprozess machen große Sprachmodelle zu vielseitig einsetzbaren Allzweckwerkzeugen bei der Textverarbeitung, mit zahlreichen Anwendungsmöglichkeiten in der Radiologie. Die größte Limitation ist die Tendenz, falsche, aber plausibel klingende Informationen mit hoher Konfidenz zu postulieren.

Autoren

Christian Blüthgen

Institutionen

Themen

Artificial Intelligence in Healthcare and EducationTopic ModelingComputational and Text Analysis Methods

Volltext beim Verlag öffnen

Technische Grundlagen großer Sprachmodelle

Abstract

Ähnliche Arbeiten

Autoren

Institutionen

Themen