{"id":144399,"date":"2026-02-26T13:37:04","date_gmt":"2026-02-26T12:37:04","guid":{"rendered":"https:\/\/multi.liora.io\/?p=144399"},"modified":"2026-07-24T17:58:42","modified_gmt":"2026-07-24T15:58:42","slug":"kreuzvalidierungsverfahren-definition-und-bedeutung-fur-machine-learning","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/kreuzvalidierungsverfahren-definition-und-bedeutung-fur-machine-learning","title":{"rendered":"Cross-Validation: Bedeutung f\u00fcr Machine Learning"},"content":{"rendered":"<p><strong>Cross-Validation (Kreuzvalidierungverfahren)&nbsp;ist eine Methode zum Testen der Leistung eines Vorhersagemodells f\u00fcr Machine Learning. Entdecke hier die am h\u00e4ufigsten verwendeten Techniken und wie Du sie beherrschen kannst.<\/strong><\/p>\n<!-- \/wp:post-content -->\n\n<!-- wp:paragraph -->\n<p>Nachdem ein <a href=\"https:\/\/liora.io\/de\/machine-learning-definition-funktionsweise-anwendungen\">Maschinelles Lernmodell<\/a> mit gekennzeichneten Daten trainiert wurde, soll es mit neuen Daten arbeiten. Jedoch ist es wichtig, die <strong>Genauigkeit der Vorhersagen des trainierten Modells<\/strong> in der Produktion <strong>sicherzustellen<\/strong>. Dazu ist es notwendig, das Modell zu validieren. Mit dem <strong>Validierungsprozess<\/strong> wird entschieden, ob numerische Ergebnisse, die hypothetische Beziehungen zwischen Variablen quantifizieren, als Beschreibungen der Daten akzeptabel sind.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Um die Leistung eines maschinellen Lernmodells zu bewerten, muss man es mit <strong>neuen Daten testen<\/strong>. Abh\u00e4ngig von der Leistung der Modelle bei unbekannten Daten kann man feststellen, ob sie unterangepasst, \u00fcberangepasst oder &#8222;gut verallgemeinert&#8220; sind. Eine der Techniken, die zum Testen der Effektivit\u00e4t eines Modells f\u00fcr maschinelles Lernen verwendet wird, ist <strong>&#8222;Cross-Validation&#8220; <\/strong>(das Kreuzvalidierungsverfahren auf Deutsch). Diese Methode ist auch ein &#8222;Resampling&#8220;-Verfahren, um ein Modell auch mit begrenzten Daten zu bewerten.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Um ein <strong>&#8222;CV&#8220; (Cross-Validation)<\/strong>&nbsp;durchzuf\u00fchren, muss man einen Teil der Daten aus dem vorgelagerten Trainingsdatensatz entfernen. Diese Daten werden nicht zum Trainieren des Modells verwendet, sondern sp\u00e4ter zum Testen und Bewerten des Modells. Kreuzvalidierungsverfahren werden h\u00e4ufig beim maschinellen Lernen verwendet, um <strong>verschiedene Modelle zu vergleichen<\/strong> und das f\u00fcr ein bestimmtes Problem am besten geeignete Modell auszuw\u00e4hlen. Es ist einfach zu verstehen, einfach zu implementieren und weniger voreingenommen als andere Methoden. Entdecke nun die wichtigsten Kreuzvalidierungsverfahren.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:embed {\"url\":\"https:\/\/youtu.be\/fSytzGwwBVw\",\"type\":\"video\",\"providerNameSlug\":\"youtube\",\"responsive\":true,\"className\":\"wp-embed-aspect-16-9 wp-has-aspect-ratio\"} -->\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\">\n  <div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Machine Learning Fundamentals: Cross Validation\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/fSytzGwwBVw?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n  <\/div>\n<\/figure>\n<!-- \/wp:embed -->\n\n<!-- wp:heading -->\n<h2 id=\"h-train-test-split-verfahren\" class=\"wp-block-heading\">Train-Test-Split Verfahren<\/h2>\n<!-- \/wp:heading -->\n\n<!-- wp:paragraph -->\n<p>Das Train-Test-Split-Verfahren besteht aus <strong>zuf\u00e4lligen Teilen eines Datensatzes<\/strong>. Ein Teil wird verwendet, um das Machine Learning-Modell zu trainieren, der andere Teil, um das Modell zu validieren. Im Allgemeinen reservieren wir <strong>70 % bis 80 % <\/strong>der Daten im Datensatz f\u00fcr das Training. Die restlichen 20 bis 30 % werden f\u00fcr die Kreuzvalidierung verwendet.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Diese Technik ist<strong> effektiv, solange die Daten nicht begrenzt sind<\/strong>. Einige Informationen \u00fcber Daten, die nicht f\u00fcr das Training verwendet wurden, k\u00f6nnen dann fehlen und die Ergebnisse k\u00f6nnen daher stark verzerrt sein. Wenn der Datensatz jedoch gro\u00df ist und die Verteilung zwischen den beiden Samples gleich ist, ist dieses Verfahren in Ordnung. Es ist m\u00f6glich, die Daten manuell aufzuteilen oder die Methode<strong style=\"text-align: var(--text-align)\"> train_test split <\/strong>von <strong style=\"text-align: var(--text-align)\">scikit-learn<\/strong> zu verwenden.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:buttons {\"className\":\"is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"} -->\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><!-- wp:button -->\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\/data-scientist\">Sich in Machine Learning weiterbilden<\/a><\/div>\n<!-- \/wp:button --><\/div>\n<!-- \/wp:buttons -->\n\n<!-- wp:heading -->\n<h3 class=\"wp-block-heading\">Die k-Folds-Kreuzvalidierung<\/h3>\n<!-- \/wp:heading -->\n\n<!-- wp:paragraph -->\n<p>Die k-Folds-Kreuzvalidierung ist <strong>einfach zu verstehen <\/strong>und besonders <strong>beliebt<\/strong>. Im Vergleich zu anderen Kreuzvalidierungsverfahren f\u00fchrt dies im Allgemeinen zu einem weniger verzerrten Modell. Mit der k-Folds-Kreuzvalidierung k\u00f6nnen Beobachtungen aus dem Originaldatensatz in der Trainingsmenge und in der Testmenge erscheinen. Bei <strong>begrenzten Eingabedaten<\/strong> ist dies daher ein sehr <strong>relevantes Verfahren<\/strong>.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Wir beginnen zun\u00e4chst damit, den <strong>Datensatz <\/strong>zuf\u00e4llig <strong>in k-Folds aufzuteilen<\/strong>. Das Verfahren hat einen einzigen Parameter namens &#8222;k&#8220;, der sich auf die Anzahl der Gruppen bezieht, in die die Probe aufgeteilt wird. Der k-Wert sollte weder zu niedrig noch zu hoch sein. Je nach Gr\u00f6\u00dfe des Datensatzes wird in der Regel ein Wert zwischen 5 und 10 gew\u00e4hlt. Falls k=10, wird der Datensatz in 10 Teile geteilt.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Ein <strong>h\u00f6herer k-Wert <\/strong>f\u00fchrt zu einem<strong> weniger verzerrten Modell<\/strong>. Jedoch kann eine zu gro\u00dfe Varianz zu einer \u00dcberanpassung f\u00fchren. Ein niedrigerer Wert entspricht der Verwendung des Train-Test-Split Verfahrens. Dann <strong>passen wir das Modell mit k-1 Folds an<\/strong>. Das Modell wird mit dem verbleibenden k-fach validiert. Ergebnisse und Fehler sollten notiert werden.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Das <strong>Verfahren wird wiederholt, bis jedes k-Fold innerhalb des Trainingssatzes dient<\/strong>. Der Durchschnitt der aufgezeichneten Bewertungen ist die Leistungsmetrik des Modells. Das <strong>Verfahren kann manuell<\/strong> oder mithilfe der Funktionen <strong>cross_val_score<\/strong> und <strong>cross_val-predict<\/strong> aus der Python-Scikit-Learn-Bibliothek durchgef\u00fchrt werden. Die cross_val_score-Funktion gibt die Punktzahl jedes Test-Folds an, w\u00e4hrend die cross_val_predict-Funktion die vorhergesagte Punktzahl f\u00fcr jede Beobachtung im Eingabedatensatz angibt, als sie Teil des Testsatzes war.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Wenn das Modell (Sch\u00e4tzer) ein Klassifikator ist und die Zielvariable (y) bin\u00e4r oder mehrklassig ist, wird standardm\u00e4\u00dfig die &#8222;StratifiedKfold&#8220;-Technik verwendet. Diese <strong>Methode meldet stratifizierte Folds<\/strong>, indem beispielsweise der Prozentsatz der Samples f\u00fcr jede Klasse in allen Folds beibehalten wird. Somit sind die Daten der Trainings und Testfaltungen gleichm\u00e4\u00dfig verteilt.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Andernfalls wird standardm\u00e4\u00dfig die K_Fold-Technik verwendet, um das Modell aufzuteilen und zu trainieren. Folds k\u00f6nnen als Iteratoren oder in einer Schleife verwendet werden, um auf einem Pandas-Datenrahmen zu trainieren.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>?Auch interessant:<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:table -->\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><tbody><tr><td><a href=\"https:\/\/liora.io\/de\/underfitting-in-machine-learning-so-loest-du-es\" target=\"_blank\" rel=\"noopener\">Underfitting im Machine Learning<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/machine-learning-definition-funktionsweise-anwendungen\" target=\"_blank\" rel=\"noopener\">Machine Learning Definition<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/kreuzvalidierungsverfahren-definition-und-bedeutung-fur-machine-learning\" target=\"_blank\" rel=\"noopener\">Kreuzvalidierungsverfahren im ML<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/q-learning-machine-learning-mit-reinforcement-learning\" target=\"_blank\" rel=\"noopener\">Q-Learning: Machine Learning mit Reinforcement Learning<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/machine-learning-clustering\" target=\"_blank\" rel=\"noopener\">Clustering im Machine Learning<\/a><\/td><\/tr><\/tbody><\/table><\/figure>\n<!-- \/wp:table -->\n\n<!-- wp:heading -->\n<h2 class=\"wp-block-heading\">Wie kann man lernen, Cross-Validation zu verwenden?<\/h2>\n<!-- \/wp:heading -->\n\n<!-- wp:paragraph -->\n<p>Die Kreuzvalidierung ist ein <strong>wesentlicher Schritt <\/strong>im Prozess des maschinellen Lernens. Um die Verwendung zu erlernen, kannst Du Dich f\u00fcr eine Liora-Weiterbildung entscheiden. Maschinelles Lernen und all seine Techniken stehen im Mittelpunkt unserer Weiterbildung zum&nbsp;<a href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Data Scientist<\/a>, <a href=\"https:\/\/liora.io\/de\/weiterbildung-data-analyst\">Data Analyst<\/a> und <a href=\"https:\/\/liora.io\/de\/weiterbildung-machine-learning-engineer\">ML Engineer<\/a>. Du lernst das gesamte Verfahren, Algorithmen, Werkzeuge und Methoden kennen, um Modelle zu trainieren und in Produktion zu bringen.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>In unseren praxisorientierten Weiterbildungen erwirbst Du alle F\u00e4higkeiten, die f\u00fcr die <strong>Berufe in Data Science<\/strong> erforderlich sind und lernst so auch die <a href=\"https:\/\/liora.io\/de\/python-programmieren\">Programmiersprache Python<\/a>, Datenbankmanipulation, <a href=\"https:\/\/liora.io\/de\/dataviz\">Dataviz<\/a> und <a href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\/deep-learning\">Deep Learning<\/a> zu beherrschen. Alle unsere Kurse k\u00f6nnen als durchgehende Weiterbildung oder als Bootcamp-Weiterbildung absolviert werden. Wir bieten Dir auch einen innovativen &#8222;Blended Learning&#8220;-Ansatz, der Fern- und Pr\u00e4senzunterricht kombiniert.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:paragraph -->\n<p>Diese Programme werden von Fachleuten konzipiert und sind auf die konkreten Bed\u00fcrfnisse von Unternehmen ausgerichtet. Die Lernenden erhalten ein von der<strong> Universit\u00e4t Sorbonne zertifiziertes Diplom<\/strong>. 93 % von ihnen haben sofort nach der Weiterbildung einen Job gefunden.&nbsp;<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:buttons {\"className\":\"is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\",\"style\":{\"spacing\":{\"margin\":{\"top\":\"var:preset|spacing|columns\",\"bottom\":\"var:preset|spacing|columns\"}}}} -->\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><!-- wp:button -->\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\/machine-learning-engineer\">Entdecke unsere Weiterbildungen!<\/a><\/div>\n<!-- \/wp:button --><\/div>\n<!-- \/wp:buttons -->\n\n<!-- wp:paragraph -->\n<p>Jetzt wei\u00dft Du alles \u00fcber Cross-Validation. Entdecke mehr <a href=\"https:\/\/liora.io\/de\/machine-learning-definition-funktionsweise-anwendungen\">\u00fcber das maschinelle Lernen<\/a>.<\/p>\n<!-- \/wp:paragraph -->\n\n<!-- wp:html -->\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Train-Test-Split Verfahren\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Beim Train-Test-Split wird der Datensatz zuf\u00e4llig in zwei Teile aufgeteilt: 70-80% f\u00fcr das Training, 20-30% f\u00fcr die Validierung. Diese Technik ist effektiv bei gro\u00dfen Datens\u00e4tzen mit gleichm\u00e4\u00dfiger Verteilung. Bei begrenzten Daten k\u00f6nnen jedoch Informationen fehlen und die Ergebnisse verzerrt sein. Die Aufteilung kann manuell oder mit scikit-learns train_test_split erfolgen.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Die k-Folds-Kreuzvalidierung\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Die k-Folds-Kreuzvalidierung teilt den Datensatz zuf\u00e4llig in k Gruppen (\u00fcblich: k=5-10). Das Modell wird mit k-1 Folds trainiert und mit dem verbleibenden Fold validiert. Dieser Prozess wird wiederholt, bis jeder Fold einmal als Testdatensatz diente. Der Durchschnitt der Ergebnisse ergibt die Leistungsmetrik. Die Methode ist besonders bei begrenzten Daten geeignet und kann mit cross_val_score und cross_val_predict aus scikit-learn umgesetzt werden. Bei Klassifikationsproblemen wird automatisch die stratifizierte Variante verwendet.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wie kann man lernen, Cross-Validation zu verwenden?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Liora bietet Weiterbildungen zum Data Scientist, Data Analyst und ML Engineer an, die maschinelles Lernen und Kreuzvalidierung umfassen. Die praxisorientierten Kurse vermitteln Python, Datenbankmanipulation, Dataviz und Deep Learning. Sie sind als durchgehende Weiterbildung oder Bootcamp verf\u00fcgbar, kombinieren Fern- und Pr\u00e4senzunterricht (Blended Learning) und schlie\u00dfen mit einem von der Universit\u00e4t Sorbonne zertifizierten Diplom ab. 93% der Absolventen finden sofort einen Job.\"\n      }\n    }\n  ]\n}\n<\/script>\n<!-- \/wp:html -->","protected":false},"excerpt":{"rendered":"<p>Cross-Validation (Kreuzvalidierungverfahren) ist eine Methode zum Testen der Leistung eines Vorhersagemodells f\u00fcr Machine Learning. Entdecke hier die am h\u00e4ufigsten verwendeten Techniken und wie Du sie beherrschen kannst. Nachdem ein Maschinelles Lernmodell mit gekennzeichneten Daten trainiert wurde, soll es mit neuen Daten arbeiten. Jedoch ist es wichtig, die Genauigkeit der Vorhersagen des trainierten Modells in der Produktion [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":219794,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-144399","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/144399","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=144399"}],"version-history":[{"count":5,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/144399\/revisions"}],"predecessor-version":[{"id":220346,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/144399\/revisions\/220346"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/219794"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=144399"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=144399"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}