{"id":164913,"date":"2022-11-24T11:32:06","date_gmt":"2022-11-24T10:32:06","guid":{"rendered":"https:\/\/liora.io\/de\/?p=164913"},"modified":"2026-02-24T16:24:47","modified_gmt":"2026-02-24T15:24:47","slug":"random-forest-definition","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/random-forest-definition","title":{"rendered":"Random Forest: Zufallswald, Definition und Funktionsweise"},"content":{"rendered":"<h2><strong>Ein Random Forest ist eine <\/strong><a href=\"https:\/\/liora.io\/de\/machine-learning-definition-funktionsweise-anwendungen\">Machine-Learning-Technik<\/a><strong>, die bei Data Scientists sehr beliebt ist, und das aus gutem Grund: Sie hat im Vergleich zu anderen Data-Algorithmen viele Vorteile.<\/strong><\/h2>\nEs ist eine einfach zu interpretierende, stabile Technik, die im Allgemeinen gute Akkuratesse aufweist und f\u00fcr Regressions- oder Klassifikationsaufgaben verwendet werden kann. Sie deckt daher einen Gro\u00dfteil der Probleme des <b>Machine Learning <\/b>ab.\n\nIn <b>Random Forest <\/b>steht zuerst das Wort &#8222;Forest&#8220; (Wald). Das bedeutet, dass der Algorithmus auf B\u00e4umen basiert, die als <b>Entscheidungsb\u00e4ume<\/b> bezeichnet werden.\n<h3>Was ist ein Entscheidungsbaum ?<\/h3>\nWie der Name schon sagt, hilft ein Entscheidungsbaum dem <strong><a href=\"https:\/\/liora.io\/de\/data-scientist-werden\">Data Scientist<\/a><\/strong>, <b>eine Entscheidung zu<\/b> <b>treffen. <\/b>Er stellt eine&nbsp; <b>Reihe von Fragen <\/b>(auch Tests genannt) und deren Antworten (ja\/nein) <b>f\u00fchren zur endg\u00fcltigen Entscheidung.<\/b>\n\nNehmen wir ein <b>Beispiel f\u00fcr eine bin\u00e4re Klassifizierung<\/b>: Ob ein Pilz essbar ist, wird anhand folgender <b>Kriterien &#8211; oder Features auf Englisch &#8211; ermittelt<\/b>: Farbe, Gr\u00f6\u00dfe des Pilzes, Form des Hutes, Geruch, Gr\u00f6\u00dfe des Stiels, Vorhandensein von Flecken etc\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"512\" height=\"446\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/unnamed-3-2.webp\" alt=\"\" loading=\"lazy\"><figcaption>Beispiel f\u00fcr einen Entscheidungsbaum<\/figcaption><\/figure>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"835\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Arbre-Random-Forest.webp\" alt=\"\" loading=\"lazy\">\n\n<figcaption>Schema eines Entscheidungsbaums<\/figcaption><\/figure>\n<blockquote><i>Im Baum <\/i><b><i>entspricht jede Frage einem Knoten, <\/i><\/b><i>d. h. einer <\/i><b><i>Stelle, an der sich ein Zweig in zwei Zweige teilt<\/i><\/b><i>. Je nachdem, wie die Antwort auf die Frage lautet, bewegen wir uns in Richtung des einen oder anderen Zweiges des Baumes, um schlie\u00dflich zu <\/i><b><i>einem Blatt <\/i><\/b><i>des Baumes (oder Ende) zu <\/i><b><i>gelangen, <\/i><\/b><i>das die Antwort auf unsere Frage enth\u00e4lt.<\/i><\/blockquote>\nVielleicht fragst Du Dich, wie man die Reihenfolge der zu stellenden Fragen ausw\u00e4hlt: <b>Warum sollte man mit dieser oder jener Frage beginnen?&nbsp;<\/b>\n\nBei jedem Knoten stellt sich der Algorithmus die Frage, <b>welche Frage er stellen <\/b>soll, d.h. ob er sich eher f\u00fcr den Geruch, die Form des Hutes oder die Gr\u00f6\u00dfe des Pilzes interessieren soll. Er berechnet also f\u00fcr jedes Feature den <b>Informationsgewinn, den <\/b>wir erhalten w\u00fcrden, wenn wir dieses Feature ausw\u00e4hlen w\u00fcrden.&nbsp;Wir wollen den Informationsgewinn maximieren. Der Baum w\u00e4hlt also die Frage aus und somit das<b> Feature, das diesen Gewinn maximiert.&nbsp;<\/b>\n<h3>Der Wald, eine Kombination von B\u00e4umen?<\/h3>\n<b>Random Forest <\/b>ist eine sogenannte Ensemble-Methode, d. h. es werden <b>Ergebnisse &#8222;zusammengesetzt<\/b>&#8220; oder <b>kombiniert, <\/b>um ein tolles Endergebnis zu erzielen.&nbsp;\n\nAber die Ergebnisse, wovon? Ganz einfach: die verschiedenen Entscheidungsb\u00e4ume, aus denen sie zusammengesetzt sind.\n\nSie k\u00f6nnen aus <b>mehreren Dutzend oder sogar Hunderten von B\u00e4umen bestehen. Die Anzahl der B\u00e4ume ist ein Parameter, der normalerweise durch <\/b>Kreuzvalidierung<b> angepasst wird. Kurz gesagt ist die Kreuzvalidierung eine <\/b>Technik zur Bewertung eines <b>Machine-Learning-Algorithmus, bei der das <\/b>Modell mit Teilen des Ausgangsdatensatzes trainiert und getestet wird.\n\n<b>Jeder Baum wird auf eine Teilmenge <\/b>des <b>Datasets trainiert und liefert ein <\/b>Ergebnis (ja oder nein in unserem Pilzbeispiel). Die <b>Ergebnisse aller <\/b>Entscheidungsb\u00e4ume werden dann zu einer endg\u00fcltigen Antwort <b>zusammengefasst. Der Baum &#8222;stimmt&#8220; ab <\/b>(ja oder nein) und die <b>endg\u00fcltige Antwort ist diejenige, die die Mehrheit der Stimmen erhalten hat<\/b>.\n\nDies ist eine sogenannte <a href=\"https:\/\/liora.io\/de\/bagging-im-machine-learning-was-ist-das\">Bagging-Methode <\/a>:&nbsp;\n<ul>\n \t<li style=\"font-weight: 400\">Wir <b>teilen <\/b>unser <b>Dataset <\/b>in mehrere <b>zuf\u00e4llig zusammengestellte Teilmengen von Stichproben auf <\/b>&#8211; daher das &#8222;Random&#8220; in Random Forest.<\/li>\n \t<li style=\"font-weight: 400\">Man <b>trainiert ein Modell auf jeder Teilmenge: Es gibt so <\/b>viele Modelle wie Teilmengen.&nbsp;<\/li>\n \t<li style=\"font-weight: 400\">Wir <b>kombinieren alle Ergebnisse der Modelle <\/b>(z. B. mit einem Abstimmungssystem), was uns ein Endergebnis liefert.<\/li>\n<\/ul>\nAuf diese Weise baut man ein robustes <b>Modell aus <\/b>mehreren Modellen auf, die nicht unbedingt gleich robust sind.\n\nDieser Algorithmus ist aufgrund seiner F\u00e4higkeit, <strong>die Ergebnisse seiner B\u00e4ume zu kombinieren,<\/strong> um ein <strong>zuverl\u00e4ssigeres Endergebnis<\/strong> zu erhalten, sehr beliebt. Aufgrund seiner Effektivit\u00e4t wird er in vielen Bereichen eingesetzt, z. B. im Telefonmarketing, um das Verhalten von Kunden vorherzusagen, oder im <b>Finanzwesen <\/b>f\u00fcr das <b>Risikomanagement<\/b>.\n\nM\u00f6chtest Du eine Ausbildung in Machine Learning beginnen? Entdecke unsere Weiterbildungen zum <a href=\"https:\/\/liora.io\/de\/weiterbildung-data-analyst\">Data Analyst<\/a>, <a href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Data Scientist<\/a> und <a href=\"https:\/\/liora.io\/de\/weiterbildung-data-engineer\">Data Engineer<\/a>!\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/terminvereinbarung\">Einen Termin vereinbaren<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Ein Random Forest ist eine Machine-Learning-Technik, die bei Data Scientists sehr beliebt ist, und das aus gutem Grund: Sie hat im Vergleich zu anderen Data-Algorithmen viele Vorteile. Es ist eine einfach zu interpretierende, stabile Technik, die im Allgemeinen gute Akkuratesse aufweist und f\u00fcr Regressions- oder Klassifikationsaufgaben verwendet werden kann. Sie deckt daher einen Gro\u00dfteil der [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":219688,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-164913","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/164913","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=164913"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/164913\/revisions"}],"predecessor-version":[{"id":217757,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/164913\/revisions\/217757"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/219688"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=164913"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=164913"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}