Hast du das richtige Profil, um in der Tech-Branche zu arbeiten? Finde es in nur 2 Minuten heraus 🚀 Mach den Test!

Data & KI

Cloud & Dev

WeiterbildungEN

Data Analyst

Data Scientist

Data Engineer

Analytics Engineer

Machine Learning Engineer

Data Marketing & AI

MLOps

ETL Developer

DataOps Engineer

Zertifizierungen

Power BI

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden

WeiterbildungEN

DevOps Engineer

Cloud Engineer

Zertifizierungen

AWS Solutions Architect

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden
Alle Weiterbildungen
Expertise

Unsere Expertise

Ihr Team weiterbilden

Top-Talente einstellen

Auszubildende einstellen

Über uns

DataScientest wird Liora

Unsere Kunden

Kontaktieren Sie uns

Unsere Engagements

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden
VerAnstaltungen

Unsere Veranstaltungen

Webinare

Live Q&A

Vor Ort Veranstaltungen

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden
Ressourcen

Decoded by Liora | Blog

Arbeitsvermittler

Karriere Management

Ambassadors

Freunde werben Freunde

Berufsbeschreibungen

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden
Warum liora?

Über uns

Methodik

Bewertungen & Testimonials

Stelle alle Deine Fragen bei unserer nächsten Q&A Live Fragerunde!

Date : Mittwoch 6 Mai
Time : 17h30

New windowAnmelden

Diese neue KI hat die Materialwissenschaften für immer verändert

2 März 2026

Forscher haben LLaMat entwickelt, eine Familie spezialisierter KI-Sprachmodelle, die größere allgemeine Systeme bei Aufgaben der Materialwissenschaft trotz weniger Parameter übertreffen. Die Modelle, basierend auf der LLaMA-Architektur von Meta und trainiert auf 30 Milliarden Token wissenschaftlicher Literatur, offenbarten eine unerwartete Erkenntnis: LLaMA-2 passt sich spezialisierterem Training besser an als das neuere LLaMA-3, was darauf hindeutet, dass fortgeschrittene Modelle domänenspezifischem Lernen widerstehen könnten.

Die bahnbrechenden Modelle erreichen ihre Leistung durch einen ausgeklügelten zweistufigen Trainingsprozess. Forscher setzten zunächst das Vortraining der LLaMA-Basismodelle mit Materialwissenschaftsliteratur fort, dann führten sie eine Instruktions-Feinabstimmung durch, wobei sie sowohl den allgemeinen OpenOrca-Datensatz als auch einen kuratierten Instruktionssatz verwendeten, der laut dem GitHub-Repository des Projekts speziell für Materialwissenschaft und Chemie entworfen wurde.

Die Trainingsinfrastruktur umfasste Cerebras CS2-Cluster für das Vortraining und NVIDIA A100-80GB-GPUs für die Instruktions-Feinabstimmung. Das Forscherteam baute seine Codebasis auf den Megatron-LLM- und Meditron-LLM-Bibliotheken auf und machte den gesamten Code zur Reproduzierbarkeit öffentlich zugänglich.

In Leistungsbewertungen bei materialwissenschaftlichen Aufgaben, einschließlich Informationsextraktion und domänenspezifischer NLP-Benchmarks, übertrafen die spezialisierten 7-Milliarden- und 13-Milliarden-Parameter LLaMat-Modelle konsequent ihre größeren allgemeinen Pendants. Dies belegt, dass gezielte Domänenspezialisierung den traditionellen Skalierungsvorteil in KI-Systemen wettmachen kann.

Unerwartete Entdeckung zur Anpassungsfähigkeit von Modellen

Die Forschung lieferte ein kontraintuitives Ergebnis zur Wahl der Basismodelle. LLaMA-3 passte sich, obwohl fortschrittlicher, weniger effektiv an das domänenbasierte Training im Bereich Materialwissenschaften an als das ältere LLaMA-2, wie in der Publikation Nature Machine Intelligence beschrieben.

Diese Entdeckung deutet darauf hin, dass Modelle, die umfassend auf allgemeinen Korpora vortrainiert wurden, eine verringerte Fähigkeit entwickeln können, hochspezialisiertes Wissen aufzunehmen. Dies hat erhebliche Auswirkungen für Forschende bei der Wahl von Basismodellen für Domänenanpassungen und suggeriert, dass „neuer“ für spezialisierte Anwendungen nicht immer besser ist.

Die Entwicklung bestätigt, dass domänenspezifisches fortgesetztes Vortraining eine hochwirksame Strategie für wissenschaftliche KI-Anwendungen darstellt. Sie demonstriert einen klaren Trade-off zwischen Modellgröße und Spezialisierung, wobei gut trainierte Modelle mittlerer Größe massive generalistische Systeme bei spezifischen Aufgaben übertreffen können.

Um Reproduzierbarkeit zu gewährleisten und weitere Forschung zu beschleunigen, hat das Team sowohl die vollständige Codebasis für Datenverarbeitung, Training und Evaluation veröffentlicht, als auch die vortrainierten und instruktionsfeinabgestimmten LLaMat-Modellgewichte auf dem Hugging Face Hub bereitgestellt. Die Hauptpublikation enthält eine umfassende Dokumentation der Einschränkungen der Modelle und ethischer Überlegungen, gemäß Nature Machine Intelligence.

Diese Arbeit etabliert ein neues Paradigma für die Entwicklung von KI-Werkzeugen für wissenschaftliche Forschung und beweist, dass strategische Spezialisierung eine überlegene Leistung liefern kann, während weniger Rechenressourcen benötigt werden als bei allgemeinen Allzweck-Alternativen.

Sources

Nature Machine Intelligence

Erhalte einen Einblick in die Zukunft – direkt in Dein Postfach. Abonniere unseren Newsletter, um die Tech-Trends von morgen, exklusive Tipps und Angebote für unsere Community zu entdecken.

Zum Newsletter anmelden

Diese neue KI hat die Materialwissenschaften für immer verändert

Unerwartete Entdeckung zur Anpassungsfähigkeit von Modellen

Sources

Wie kann die Ausbildung finanziert werden?

Wie kann die Ausbildung finanziert werden?

Programming with Python

Diese neue KI hat die Materialwissenschaften für immer verändert

Der Newsletter der Zukunft

Unerwartete Entdeckung zur Anpassungsfähigkeit von Modellen

Sources

Der Newsletter der Zukunft