{"id":182836,"date":"2026-01-28T12:21:11","date_gmt":"2026-01-28T11:21:11","guid":{"rendered":"https:\/\/liora.io\/de\/?p=182836"},"modified":"2026-07-31T21:23:01","modified_gmt":"2026-07-31T19:23:01","slug":"resampling-eine-methode-zum-datenabgleich","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/resampling-eine-methode-zum-datenabgleich","title":{"rendered":"Resampling: Eine Methode zum Datenabgleich"},"content":{"rendered":"\n<p><strong>Unausgewogene Daten sind beim Machine Learning sehr h\u00e4ufig anzutreffen. Leider machen sie die vorausschauende Analyse komplexer. Um diese Datens\u00e4tze auszugleichen, wurden verschiedene Methoden . Dazu geh\u00f6rt auch das Resampling.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"wie-geht-man-mit-unausgewogenen-daten-durch-resampling-um\">Wie geht man mit unausgewogenen Daten durch Resampling um?<\/h2>\n\n\n\n<p>Unausgewogene Daten zeichnen sich durch Stichproben aus, bei denen eine starke Ungleichheit festzustellen ist. So liegt das Verh\u00e4ltnis zwischen den Klassen nicht bei 50\/50, sondern eher bei 90\/10. Ab diesem Zeitpunkt werden die Daten f\u00fcr Machine Learning und Deep Learning problematisch.<\/p>\n\n\n\n<p>Dies bezieht sich oft auf relativ seltene Ereignisse, wie z. B. Versicherungsbetrug oder die Entdeckung einer Krankheit. Zum Beispiel kann es sein, dass in einer Bev\u00f6lkerung die gro\u00dfe Mehrheit gesund ist und nur 0,1 % an Multipler Sklerose leiden. Die gesunden Menschen sind dann die Mehrheitsklasse und die kranken Menschen gelten als Minderheitsklasse. Obwohl diese Ereignisse recht h\u00e4ufig vorkommen, machen sie nur einen sehr kleinen Teil der untersuchten Stichprobe aus. Daher ist es schwierig, sie vorherzusagen.<\/p>\n\n\n\n<p>Im Machine Learning sind unausgewogene Daten sehr h\u00e4ufig, insbesondere bei der <a href=\"https:\/\/liora.io\/de\/umgang-mit-problemen-bei-unausgewogener-klassifizierung-teil-ii\">bin\u00e4ren Klassifizierung.<\/a> Aus diesem Grund werden verschiedene Methoden entwickelt, um Probleme mit unausgewogener Klassifizierung besser in den Griff zu bekommen. Dazu geh\u00f6rt auch das Resampling von Daten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"was-sind-die-beiden-methoden-des-resampling\">Was sind die beiden Methoden des Resampling?<\/h2>\n\n\n\n<p>Beim Resampling wird der Datensatz ver\u00e4ndert, bevor das Vorhersagemodell trainiert wird. Dadurch werden die Daten ausgeglichen, um die Vorhersage zu erleichtern.<\/p>\n\n\n\n<p>Zu diesem Zweck gibt es zwei <strong>Methoden des Resampling.<\/strong><\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"oversampling\">Oversampling<\/h3>\n\n\n\n<p><strong>Oversampling<\/strong> bedeutet, dass die Anzahl der Daten, die der Minderheitsklasse angeh\u00f6ren, erh\u00f6ht wird, bis ein gewisses Gleichgewicht erreicht ist. Oder zumindest eine Quote, die f\u00fcr zuverl\u00e4ssige Vorhersagen ausreicht.<\/p>\n\n\n\n<p>Data Scientists k\u00f6nnen zwei Methoden des Upsampling anwenden. N\u00e4mlich:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Zuf\u00e4lliges Oversampling<\/strong>: Hier werden die Minderheitsdaten mehrmals zuf\u00e4llig geklont. Diese Technik ist vor allem bei linearen Modellen, wie der logistischen Regression, n\u00fctzlich.<\/li>\n<li><strong>Synthetisches Oversampling:<\/strong> Auch hier geht es darum, Daten aus Minderheitsklassen hinzuzuf\u00fcgen. Anstatt sie jedoch eins zu eins zu kopieren, erstellt der Algorithmus separate, aber \u00e4hnliche Daten.<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"undersampling\">Undersampling<\/h3>\n\n\n\n<p>Haupts\u00e4chlich wird <strong>zuf\u00e4lliges Undersampling<\/strong> verwendet. Das hei\u00dft, dass die Mehrheitsdaten nach dem <a href=\"https:\/\/liora.io\/de\/einfuehrung-in-die-wahrscheinlichkeitsrechnung-teil-1\">Zufallsprinzip<\/a> entfernt werden. Diese Resampling-Technik sollte bevorzugt werden, wenn du \u00fcber gro\u00dfe Datens\u00e4tze verf\u00fcgst (mindestens mehrere zehntausend F\u00e4lle).<\/p>\n\n\n\n<p>W\u00e4hrend dies die g\u00e4ngigste Methode ist, kannst du auch das Undersampling von Grenzbeobachtungen oder das Clustering-based Undersampling verwenden. Das hei\u00dft, bestimmte Mehrheitsdaten gezielt zu entfernen.<\/p>\n\n\n\n<p>In beiden F\u00e4llen ist es nicht notwendig, ein perfektes 50\/50-Gleichgewicht zu erreichen. Es ist durchaus m\u00f6glich, Mehrheitsdaten zu entfernen oder Minderheitsdaten hinzuzuf\u00fcgen, um ein Verh\u00e4ltnis von 45\/55 oder 40\/60 zu erreichen.<\/p>\n\n\n\n<p>Du kannst auch verschiedene Klassenverh\u00e4ltnisse ausprobieren, um das Verh\u00e4ltnis mit der besten Vorhersageleistung auszuw\u00e4hlen.<\/p>\n\n\n\n<p>Wenn du mehr \u00fcber das Resampling von unausgewogenen Daten erfahren m\u00f6chtest, solltest du dir unsere Kurse in Data Science ansehen.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center wp-container-core-buttons-is-layout-5ee10de4\" style=\"margin-top:32px;margin-bottom:32px\"><div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">\nEntdecke unsere Weiterbildungen\n<\/a><\/div><\/div>\n\n","protected":false},"excerpt":{"rendered":"<p>Unausgewogene Daten sind beim Machine Learning sehr h\u00e4ufig anzutreffen. Leider machen sie die vorausschauende Analyse komplexer. Um diese Datens\u00e4tze auszugleichen, wurden verschiedene Methoden . Dazu geh\u00f6rt auch das Resampling.<\/p>\n","protected":false},"author":78,"featured_media":182838,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-182836","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182836","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/78"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=182836"}],"version-history":[{"count":4,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182836\/revisions"}],"predecessor-version":[{"id":222365,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182836\/revisions\/222365"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/182838"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=182836"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=182836"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}