{"id":175495,"date":"2026-01-28T12:44:13","date_gmt":"2026-01-28T11:44:13","guid":{"rendered":"https:\/\/liora.io\/de\/?p=175495"},"modified":"2026-02-19T13:44:21","modified_gmt":"2026-02-19T12:44:21","slug":"overfitting-was-ist-das-wie-kann-man-es-vermeiden","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/overfitting-was-ist-das-wie-kann-man-es-vermeiden","title":{"rendered":"Overfitting: Was ist das? Wie kann man es vermeiden?"},"content":{"rendered":"\n<p><strong>In diesem Artikel stellen wir dir einen der Stolpersteine von \u00fcberwachten Lernalgorithmen vor, das \u00dcberlernen oder Overfitting auf Englisch.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-was-ist-overfitting\">Was ist Overfitting?<\/h2>\n\n\n\n<p><strong>Overfitting<\/strong> ist das Risiko, dass ein Modell die Trainingsdaten &#8222;auswendig&#8220; lernt. Auf diese Weise riskiert es, dass es nicht in der Lage ist, auf unbekannte Daten zu verallgemeinern.<\/p>\n\n\n\n<p>Ein Modell, das z. B. das Label f\u00fcr die Trainingsdaten und eine Zufallsvariable f\u00fcr unbekannte Daten zur\u00fcckgibt, w\u00fcrde w\u00e4hrend des Trainings sehr gut abschneiden, aber nicht f\u00fcr neue Daten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-wann-besteht-die-gefahr-dass-overfitting-auftritt\">Wann besteht die Gefahr, dass Overfitting auftritt?<\/h2>\n\n\n\n<p><strong>Overfitting<\/strong> kann auftreten, wenn das gew\u00e4hlte Modell im Verh\u00e4ltnis zur Gr\u00f6\u00dfe des Datensatzes zu komplex ist. Zum Beispiel ist das hier gew\u00e4hlte Modell eine polynomiale <a href=\"https:\/\/liora.io\/de\/logistische-regression-was-ist-das-denn\">Regression<\/a>, die sich selbst zwingt, so viele Punkte wie m\u00f6glich in den Trainingsdaten zu durchlaufen, weil der gew\u00e4hlte Grad zu gro\u00df ist.<\/p>\n\n\n\n<p>Dadurch l\u00e4sst es viele Punkte aus, die w\u00e4hrend des Trainings nicht gesehen wurden. Bei Trainingsdaten schneidet dieses Modell sehr gut ab, aber bei ungesehenen Daten kann der quadratische Fehler enorm sein.&lt;br&gt;.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=&#8220;.svg&#8220;]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/04\/Illu1-overfitting-scaled-1-1024x605.jpg\" alt=\"\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-warum-ist-overfitting-ein-problem\">Warum ist Overfitting ein Problem?<\/h2>\n\n\n\n<p>Aufgrund von <strong>Overfitting<\/strong> repr\u00e4sentiert ein Modell die Daten, mit denen es trainiert wurde, nur unzureichend.<\/p>\n\n\n\n<p>Daher ist seine Genauigkeit bei neuen, \u00e4hnlichen Daten geringer als bei einem ideal angepassten Modell. Wenn man es jedoch auf die Trainingsdaten anwendet, scheint das \u00fcberfitte Modell eine h\u00f6here Genauigkeit zu bieten. Es ist daher sehr leicht, sich in die Irre f\u00fchren zu lassen.<\/p>\n\n\n\n<p>Ohne Overfitting-Schutz k\u00f6nnen Entwickler ein Modell trainieren und einsetzen, das auf den ersten Blick hochgenau ist. In Wirklichkeit wird dieses Modell in der Produktion mit neuen Daten eine schlechtere Leistung erbringen.<\/p>\n\n\n\n<p>Der Einsatz eines solchen Modells kann alle m\u00f6glichen Probleme verursachen. Beispielsweise kann ein Modell, das zur Vorhersage der Wahrscheinlichkeit eines Zahlungsausfalls verwendet wird, im Falle eines Overfittings einen viel h\u00f6heren Prozentsatz als die Realit\u00e4t anzeigen. Dies kann zu falschen Entscheidungen f\u00fchren, was wiederum zu Umsatzeinbu\u00dfen und unzufriedenen Kunden f\u00fchrt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-overfitting-vs-underfitting\">Overfitting vs Underfitting<\/h2>\n\n\n\n<p>Im <strong>Gegensatz zum Overfitting<\/strong> tritt das Underfitting auf, wenn die Trainingsdaten stark verzerrt sind. Wenn z. B. ein Problem \u00fcberm\u00e4\u00dfig vereinfacht wird, funktioniert das Modell auf den Trainingsdaten nicht richtig. Dies kann durch Daten verursacht werden, die Rauschen oder falsche Werte enthalten. Das Modell wird daher nicht in der Lage sein, Muster aus dem <a href=\"https:\/\/liora.io\/de\/datasets-top-5-websites-fuer-qualitativ-hochwertige-datensaetze\">Datensatz<\/a> herauszufiltern.<\/p>\n\n\n\n<p>Eine weitere Ursache kann ein stark verzerrtes Modell sein, weil es nicht in der Lage ist, die Beziehung zwischen den Trainingsbeispielen und den Zielwerten zu erfassen. Der dritte Grund kann ein zu einfaches Modell sein, wie z. B. ein lineares Modell, das mit komplexen Szenarien trainiert wird.<\/p>\n\n\n\n<p>Beim Versuch, <strong>Overfitting<\/strong> zu vermeiden, besteht die Gefahr, Underfitting zu verursachen. Dies kann geschehen, indem man den Trainingsprozess fr\u00fcher abbricht oder seine Komplexit\u00e4t durch das Entfernen der weniger relevanten Eingaben reduziert. Wenn das Training zu fr\u00fch abgebrochen wird oder wichtige Merkmale entfernt werden, kann Underfitting auftreten. In beiden F\u00e4llen wird das Modell nicht in der Lage sein, Trends innerhalb des Datasets zu erkennen.<\/p>\n\n\n\n<p>Daher ist es entscheidend, die ideale Anpassung zu finden, damit das Modell die Muster in den Trainingsdaten erkennt, ohne sich zu genaue Details zu merken. Das ist es, was das Modell in die Lage versetzt, zu verallgemeinern und andere Datenproben genau vorherzusagen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-wie-vermeidet-man-overfitting\">Wie vermeidet man Overfitting ?<\/h2>\n\n\n\n<p>Um <strong>Overfitting<\/strong> zu vermeiden, muss das Modell daher jedes Mal neu bewertet werden, und zwar anhand von Daten, die w\u00e4hrend des Trainings nicht gesehen wurden.<\/p>\n\n\n\n<p>Eine gute Praxis ist es, den anf\u00e4nglichen Datensatz in einen <strong>Trainingssatz (train set) und einen Testsatz (test set)<\/strong> aufzuteilen. Der erste Satz wird dazu verwendet, das Modell zu trainieren. Der Testsatz, der aus ungesehenen Daten besteht, dient dazu, zu testen, wie das Modell generalisiert wird.<\/p>\n\n\n\n<p>Die Leistung des Modells kann nur anhand der Leistung des Testsatzes beurteilt werden, nicht anhand der Leistung des Trainingssatzes, der m\u00f6glicherweise auswendig gelernt wird.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-wie-wahlt-man-trainings-und-testdaten-aus\">Wie w\u00e4hlt man Trainings- und Testdaten aus?<\/h2>\n\n\n\n<p>Die einfachste und am h\u00e4ufigsten verwendete Methode ist es, die Daten nach dem Zufallsprinzip zu trennen. Das <a href=\"https:\/\/liora.io\/de\/top-10-der-python-bibliotheken-fur-data-scientists\">Python-Modul sklearn.model_selection<\/a> bietet zu diesem Zweck die Funktion train_test_split. Durch die \u00dcbergabe eines Datensatzes an diese Funktion wird eine Partition des Datensatzes erstellt, wodurch der Testsatz und der Trainingssatz erhalten werden.<\/p>\n\n\n\n<p>Diese Trennung erfolgt jedoch zuf\u00e4llig. Es besteht also die Gefahr, dass zuf\u00e4llig nicht repr\u00e4sentative Datens\u00e4tze erzeugt werden. Um zu vermeiden, dass ein Modell auf nicht <strong>repr\u00e4sentativen Daten<\/strong> validiert wird, besteht eine Methode darin, den Trainingsvorgang mit einem Satz zu wiederholen, dann mit einem anderen Satz mehrmals zu testen und die Ergebnisse zu mitteln.<\/p>\n\n\n\n<p>Dadurch werden die zuf\u00e4lligen Effekte gemittelt und man erh\u00e4lt eine Sch\u00e4tzung der Leistung auf zuf\u00e4llig ausgew\u00e4hlten ungesehenen Daten. Diese Modellvalidierung nennt man <a href=\"https:\/\/liora.io\/de\/kreuzvalidierungsverfahren-definition-und-bedeutung-fur-machine-learning\">Kreuzvalidierung oder englisch cross validation.<\/a><\/p>\n\n\n\n<p>Eine Kreuzvalidierung besteht aus mehreren Folds. Jeder Fold ist eine Partition des Datensatzes in zwei S\u00e4tze (Trainings- und Testsatz). Bei der Kreuzvalidierung wird das Modell f\u00fcr jeden Fold zun\u00e4chst im Trainingssatz trainiert und dann im Testsatz bewertet.<\/p>\n\n\n\n<p>Wir k\u00f6nnen dann die Leistung des Modells sch\u00e4tzen, indem wir die Leistung der Pr\u00e4diktoren f\u00fcr jede Fold auf dem Testsatz f\u00fcr jede Fold bewerten und dann ihre Leistung mitteln. Dieser Ansatz erm\u00f6glicht auch den Zugriff auf die Standardabweichung dieser Leistungen, was einen guten Eindruck von der Variabilit\u00e4t des Modells in Bezug auf den Trainingssatz vermittelt.<\/p>\n\n\n\n<p>Wenn die Variabilit\u00e4t hoch ist, dann m\u00fcssen wir bei der Wahl unseres Trainingssatzes umso vorsichtiger sein. Im Gegensatz dazu ist bei einer geringen Variabilit\u00e4t die Wahl des Trainingssatzes nicht sehr wichtig.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/04\/Illu2-overfitting-scaled-1-1024x605.jpg\" alt=\"\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-was-sind-die-fehlerquellen-eines-modells\">Was sind die Fehlerquellen eines Modells?<\/h2>\n\n\n\n<p>Bei einem <strong>Regressionsmodell<\/strong> ist das erste Bewertungskriterium der mittlere quadratische Fehler oder MSE f\u00fcr mean squared error.<\/p>\n\n\n\n<p>Unser Datensatz D besteht aus n Realisierungen (xi, yi) eines Zufallsvektors mit der gleichen Gesetzm\u00e4\u00dfigkeit wie ein Paar Zufallsvariablen (X, Y), die durch die Beziehung Y = f(X) + eps verbunden sind, wobei eps eine Zufallsvariable mit dem Erwartungswert Null und der Varianz Sigma\u00b2 ist, d.h. das Rauschen der Daten.<\/p>\n\n\n\n<p>Wir k\u00f6nnen den mittleren quadratischen Fehler \u00fcber D eines Sch\u00e4tzers als die Summe aus :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Aus dem Quadrat des Bias des Sch\u00e4tzers (der quantifiziert, wie weit die vorhergesagten Etiketten von der Realit\u00e4t entfernt sind).<\/li>\n\n\n\n<li>Der Varianz des Sch\u00e4tzers (die quantifiziert, wie sich die Etiketten f\u00fcr ein und dieselbe Person in Abh\u00e4ngigkeit von den Eingabedaten \u00e4ndern).<\/li>\n\n\n\n<li>Der Varianz des Rauschens, auch irreduzibler Fehler genannt.<\/li>\n<\/ul>\n\n\n\n<p>Daher kann ein verzerrter Sch\u00e4tzer mit einer geringen Varianz besser abschneiden als ein unverzerrter Sch\u00e4tzer mit einer gro\u00dfen Varianz.<\/p>\n\n\n\n<p>In sehr vielen F\u00e4llen tritt Overfitting in den F\u00e4llen auf, in denen ein wenig verzerrter Sch\u00e4tzer mit hoher Varianz gew\u00e4hlt wird. Komplexe Modelle k\u00f6nnen diese Eigenschaften aufweisen, wie z. B. polynomiale Regressionen mit zu gro\u00dfer Ordnung (siehe Abbildung 1). Die Wahl einfacherer und auf den ersten Blick &#8222;schlechterer&#8220;, weil verzerrter Modelle kann daher zu einer besseren Leistung f\u00fchren, wenn ihre Varianz gering ist!<\/p>\n\n\n\n<p>Wenn du mehr \u00fcber Overfitting und<a href=\"https:\/\/liora.io\/de\/image-processing-grundlagen-und-praktische-anwendung\"> k\u00fcnstliche Intelligenz, die auf Bilder angewandt wird<\/a>, erfahren m\u00f6chtest :<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\">Entdecke unsere Data Science Weiterbildungen<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Was ist Overfitting?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Overfitting (\u00dcberlernen) bezeichnet das Risiko, dass ein Modell die Trainingsdaten 'auswendig' lernt, anstatt die zugrundeliegenden Muster zu verstehen. Die Folge ist, dass das Modell auf neuen, unbekannten Daten schlecht generalisiert und versagt, obwohl es auf den Trainingsdaten hervorragende Ergebnisse liefert.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wann besteht die Gefahr, dass Overfitting auftritt?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Overfitting tritt typischerweise auf, wenn das gew\u00e4hlte Modell im Verh\u00e4ltnis zur Gr\u00f6\u00dfe des Datensatzes zu komplex ist. Ein Beispiel ist eine polynomiale Regression mit zu hohem Grad, die sich zwingt, m\u00f6glichst viele Trainingspunkte exakt zu durchlaufen. Dadurch verfehlt sie viele nicht gesehene Punkte \u2013 der Fehler auf neuen Daten kann enorm sein.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Warum ist Overfitting ein Problem?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Overfitting f\u00fchrt dazu, dass ein Modell die Trainingsdaten nur unzureichend repr\u00e4sentiert und auf neuen Daten eine geringere Genauigkeit aufweist als ein ideal angepasstes Modell. Da es auf den Trainingsdaten aber scheinbar hochgenau ist, kann dies t\u00e4uschen. In der Produktion f\u00fchrt ein \u00fcberfittes Modell zu schlechteren Leistungen, was falsche Entscheidungen, Umsatzeinbu\u00dfen und unzufriedene Kunden verursachen kann.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Overfitting vs Underfitting\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Underfitting tritt auf, wenn die Trainingsdaten stark verzerrt sind, das Modell zu einfach ist oder wichtige Merkmale fehlen. Das Modell erkennt dann keine Muster. Bei der Vermeidung von Overfitting besteht die Gefahr, in Underfitting zu verfallen (z.B. durch zu fr\u00fchen Trainingsabbruch oder Entfernen wichtiger Merkmale). Ziel ist die ideale Anpassung, bei der das Modell Muster erkennt, ohne Details auswendig zu lernen \u2013 nur so kann es gut generalisieren.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wie vermeidet man Overfitting ?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Die wichtigste Methode ist die regelm\u00e4\u00dfige Bewertung des Modells anhand von Daten, die nicht im Training verwendet wurden. Dazu wird der Datensatz in Trainingssatz (zum Trainieren) und Testsatz (zum Evaluieren) aufgeteilt. Die tats\u00e4chliche Leistung des Modells wird nur anhand des Testsatzes beurteilt, da der Trainingssatz m\u00f6glicherweise auswendig gelernt wurde.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wie w\u00e4hlt man Trainings- und Testdaten aus?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Die einfachste Methode ist die zuf\u00e4llige Aufteilung mit der Funktion train_test_split aus sklearn.model_selection. Da dies aber nicht repr\u00e4sentative Datens\u00e4tze erzeugen kann, empfiehlt sich die Kreuzvalidierung (cross validation): Der Datensatz wird in mehrere Folds aufgeteilt, das Modell wird f\u00fcr jeden Fold trainiert und getestet, und die Ergebnisse werden gemittelt. Dies liefert auch Informationen \u00fcber die Variabilit\u00e4t des Modells.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Was sind die Fehlerquellen eines Modells?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Der mittlere quadratische Fehler (MSE) eines Modells setzt sich aus drei Komponenten zusammen: dem Quadrat des Bias (systematische Abweichung), der Varianz des Sch\u00e4tzers (Abh\u00e4ngigkeit von den Eingabedaten) und der Varianz des Rauschens (irreduzibler Fehler). Overfitting tritt oft bei wenig verzerrten Sch\u00e4tzern mit hoher Varianz auf (z.B. polynomiale Regression mit zu hohem Grad). Ein verzerrter, aber varianzarmer Sch\u00e4tzer kann besser abschneiden.\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>In diesem Artikel stellen wir dir einen der Stolpersteine von \u00fcberwachten Lernalgorithmen vor, das \u00dcberlernen oder Overfitting auf Englisch. Was ist Overfitting? Overfitting ist das Risiko, dass ein Modell die Trainingsdaten \u201eauswendig\u201c lernt. Auf diese Weise riskiert es, dass es nicht in der Lage ist, auf unbekannte Daten zu verallgemeinern. Ein Modell, das z. B. [\u2026]<\/p>\n","protected":false},"author":82,"featured_media":175496,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-175495","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175495","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/82"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=175495"}],"version-history":[{"count":5,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175495\/revisions"}],"predecessor-version":[{"id":218632,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175495\/revisions\/218632"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/175496"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=175495"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=175495"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}