Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.
Technische Grundlagen großer Sprachmodelle
3
Zitationen
1
Autoren
2025
Jahr
Abstract
Zusammenfassung Hintergrund Große Sprachmodelle (Large Language Models, LLMs) wie ChatGPT haben die Art und Weise, wie Computer menschliche Sprache analysieren können und wie wir mit Computern interagieren können, in nur kurzer Zeit revolutioniert. Fragestellung Überblick über die Entstehung und die Grundprinzipien von computergestützten Sprachmodellen. Methoden Narrative literaturgestützte Beleuchtung der Entstehungsgeschichte von Sprachmodellen, der technischen Grundlagen, des Trainingsprozesses und der Limitationen großer Sprachmodelle. Ergebnisse Große Sprachmodelle basieren heutzutage meist auf Transformer-Modellen, die durch ihren Aufmerksamkeitsmechanismus Kontext erfassen können. Durch einen mehrstufigen Trainingsprozess mit umfassendem Vortraining, überwachtem Feintuning und Alignment mit menschlichen Präferenzen haben große Sprachmodelle ein generelles Sprachverständnis entwickelt. So sind sie in der Lage, flexibel Texte zu analysieren sowie mit hoher Qualität zu erzeugen. Schlussfolgerung Ihre technischen Grundlagen und ihr Trainingsprozess machen große Sprachmodelle zu vielseitig einsetzbaren Allzweckwerkzeugen bei der Textverarbeitung, mit zahlreichen Anwendungsmöglichkeiten in der Radiologie. Die größte Limitation ist die Tendenz, falsche, aber plausibel klingende Informationen mit hoher Konfidenz zu postulieren.
Ähnliche Arbeiten
Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI
2019 · 8.700 Zit.
Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead
2019 · 8.605 Zit.
High-performance medicine: the convergence of human and artificial intelligence
2018 · 8.133 Zit.
BioBERT: a pre-trained biomedical language representation model for biomedical text mining
2019 · 6.873 Zit.
Proceedings of the 19th International Joint Conference on Artificial Intelligence
2005 · 5.781 Zit.