{"id":181046,"date":"2023-07-20T18:06:43","date_gmt":"2023-07-20T17:06:43","guid":{"rendered":"https:\/\/liora.io\/de\/?p=181046"},"modified":"2026-02-06T06:32:10","modified_gmt":"2026-02-06T05:32:10","slug":"was-ist-predictive-modeling","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/was-ist-predictive-modeling","title":{"rendered":"Was ist Predictive Modeling?"},"content":{"rendered":"<h3>Predictive Modeling: Wie wird das Wetter morgen sein? Kann man den B\u00f6rsenkurs vorhersagen? Kann man &#8222;erraten&#8220;, ob ein Patient an einer Krankheit leiden wird oder nicht? Wie kann man das Verhalten von Kunden besser verstehen, um ihnen ein passendes Angebot zu machen? Das sind Fragen, auf die Datenwissenschaftler und Statistiker engagiert nach Antworten suchen, indem sie Methoden der vorausschauenden Modellierung oder Predictive Modelling anwenden.<\/h3>\n<p>Es lag schon immer in der Natur des Menschen,<strong> vorausschauend zu denken<\/strong> und sich mit den ihm zur Verf\u00fcgung stehenden Mitteln so gut wie m\u00f6glich an die aktuellen Bedingungen anzupassen. Die Evolution basiert auf der F\u00e4higkeit von Lebewesen, sich anzupassen und sich daher implizit gut auf aktuelle Situationen vorzubereiten, um sich g\u00fcnstige <strong>Bedingungen zu sichern.<\/strong><\/p>\n<p>Manchmal werden diese Vorhersageoperationen viel zu komplex, als dass sie vom menschlichen Gehirn durchgef\u00fchrt werden k\u00f6nnten. Daher ist es wichtig, diese Konzepte zu formalisieren und die Aufgabe einem Algorithmus zuzuweisen.<\/p>\n<p>Au\u00dferdem neigt unser <strong>Gehirn zu kognitiven oder psychologischen<\/strong> Verzerrungen, die uns zu irrationalen Entscheidungen f\u00fchren k\u00f6nnen, und diese Fehler sind weniger pr\u00e4sent, wenn man einen Algorithmus verwendet.<\/p>\n<p>Heute haben wir Werkzeuge, die es uns erm\u00f6glichen, die Ph\u00e4nomene, die wir beobachten, zu modellieren (in eine abstrakte, mathematische Sprache zu \u00fcbersetzen). Die Modellierung von Vorhersagen erm\u00f6glicht es, Antworten zu finden, die mit den uns zur Verf\u00fcgung stehenden Daten in Zusammenhang stehen.<\/p>\n<h3>Wie macht man pr\u00e4diktive Modellierung?<\/h3>\n<p>Die von <strong>Algorithmen<\/strong> verwendeten mathematischen und statistischen Methoden beruhen oft auf Techniken, die recht abstrakte Begriffe verwenden.<\/p>\n<p>Wenn man &#8222;<strong>predictive modeling<\/strong>&#8220; betreiben will, ist es hilfreich, den eingesetzten Algorithmus als eine Funktion zu sehen, die Daten als Input nimmt und Informationen als Output zur\u00fcckgibt.<\/p>\n<p>Es ist auch sehr wichtig, die Bedeutung der<strong> Parameter des Algorithmus<\/strong> zu verstehen, um sie unter Ber\u00fccksichtigung der Besonderheiten der Daten und der zu erf\u00fcllenden Aufgaben anpassen zu k\u00f6nnen.<\/p>\n<p>Die Qualit\u00e4t der Daten hat einen gro\u00dfen Einfluss auf die erzielten Ergebnisse. Bevor du mit irgendeiner Analyse beginnst, solltest du daran denken, eine <strong>explorative Datenanalyse<\/strong> durchzuf\u00fchren und mit fehlenden Daten, Ausrei\u00dfern, Duplikaten usw. umzugehen.<\/p>\n<p>Es ist zu beachten, dass jedes Unternehmen seine eigenen Protokolle hat, und wenn man eine Antwort auf eine Frage sucht, wird die Arbeit sehr oft im Team mit Spezialisten auf dem Gebiet durchgef\u00fchrt, was den Wissenschaftlern erm\u00f6glicht, die Herausforderungen zu verstehen und die am besten geeigneten Techniken anzuwenden.<\/p>\n<h3>Predictive Modeling &#8211; Konkret bedeutet das also..?<\/h3>\n<p>Wie bereits beschrieben, wird die pr\u00e4diktive <strong>Modellierung verwendet,<\/strong> um das Verhalten einer Metrik (Messgr\u00f6\u00dfe) aus den beobachteten Daten vorherzusagen.<\/p>\n<p>Zun\u00e4chst muss man damit beginnen, sich die richtigen Fragen zu stellen und bereit sein, sie im Laufe der Zeit zu \u00e4ndern, denn es gibt kein fertiges Rezept. Nachdem du eine Problemstellung aus einem Dataset definiert hast, w\u00e4hlst du je nach dessen Spezifit\u00e4t einen geeigneten Ansatz, der es dir erm\u00f6glicht, zu Antworten oder Elementen einer Antwort zu gelangen. Um zu sehen, wie das in der Praxis funktioniert, schauen wir uns zwei Beispiele an.<\/p>\n<h3>Beispiel 1: Sozial- und Gesundheitsdaten<\/h3>\n<h4>Explorative Analyse<\/h4>\n<p>Das folgende Beispiel stammt von <a href=\"https:\/\/liora.io\/de\/kaggle-alles-was-du-ueber-diese-plattform-wissen-musst\">Kaggle<\/a>, einer Webplattform, die Wettbewerbe im Bereich Data Science veranstaltet.<\/p>\n<p>Um es einfach zu machen, nehmen wir eine Probe aus einem Dataset mit Daten \u00fcber Personen, die einige Indikatoren \u00fcber ihren sozialen Hintergrund und einige medizinische Informationen enthalten. Wir sehen hier 5 Personen (auf den Linien). Jede Person hat 12 Merkmale (in den Spalten), die sie charakterisieren.<\/p>\n<p><img decoding=\"async\" width=\"512\" height=\"74\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-10.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-10.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-10-300x43.png 300w\" sizes=\"(max-width: 512px) 100vw, 512px\"><\/p>\n<p>Die <strong>Person mit der ID 29172 ist z. B. eine 68-j\u00e4hrige Frau<\/strong>, die verheiratet war und in einer l\u00e4ndlichen Gegend lebt, nie geraucht hat und weder Bluthochdruck noch Herzprobleme hatte. Wir haben auch ihren durchschnittlichen Blutzuckerspiegel und ihren BMI ermittelt.<\/p>\n<p>Was uns am <strong>meisten interessiert, ist die letzte Spalte, &#8222;stroke&#8220;,<\/strong> aus der hervorgeht, ob die Person in der Vergangenheit einen Schlaganfall erlitten hat oder nicht.<\/p>\n<p>Bevor wir uns an die Klassifizierung machen, ist es sinnvoll, eine explorative Analyse durchzuf\u00fchren und zu sehen, wie sich die Personen mit der <a href=\"https:\/\/liora.io\/de\/clean-das-revolutionaere-neue-data-tool-fuer-die-medizin\">Krankheit auf die Daten verteilen.<\/a><\/p>\n<p>Um eine Frage aus dem Gesch\u00e4ftsleben oder der klinischen Forschung beantworten zu k\u00f6nnen, m\u00f6chte man wissen, welches Profil am ehesten diese Krankheit entwickeln wird, oder vorhersagen, ob eine neue Person mit hoher Wahrscheinlichkeit diese Krankheit entwickeln wird.<\/p>\n<p>Um festzustellen, welche Merkmale die Krankheit am meisten beeinflussen, kann man eine grafische Darstellung mit den Prozents\u00e4tzen der erkrankten Personen nach ihrem Profil machen.<\/p>\n<p>Hier zeigt sich, dass Personen, die rauchen und fr\u00fcher geraucht haben, eine h\u00f6here Neigung zu Schlaganf\u00e4llen haben als Personen, die nie geraucht haben.<\/p>\n<p>Bei Personen mit Bluthochdruck ist die Wahrscheinlichkeit, einen Schlaganfall zu erleiden, h\u00f6her.<\/p>\n<p>F\u00fcr diese Analyse ist es also interessant, Profile herauszuarbeiten, die ein Risiko darstellen, und somit seine Ansprache anzupassen, um optimale Entscheidungen treffen zu k\u00f6nnen.<\/p>\n<h4> Klassifizierung<\/h4>\n<p>Nachdem du eine explorative Studie durchgef\u00fchrt hast, kannst du einen Klassifikationsansatz verfolgen. Die Klassifizierung, wie der Name schon sagt, dient dazu, Klassen (Gruppen) unter den Individuen zu bilden.<\/p>\n<p>Wir m\u00f6chten nun neue Daten erheben und vorhersagen, ob z. B. eine Person mit einem bestimmten Profil die <strong>Voraussetzungen f\u00fcr einen Schlaganfall<\/strong> erf\u00fcllt. In diesem Fall w\u00fcrden wir also einen Klassifizierungsansatz verfolgen, d. h. wir w\u00fcrden der Person ein Label zuweisen: 0, wenn die Person gesund ist, oder 1, wenn die Person krank ist.<\/p>\n<p>Je nach Problemstellung und Daten hat man verschiedene Methoden oder Modelle. Zu den Klassifikationsalgorithmen geh\u00f6ren <a href=\"https:\/\/liora.io\/de\/der-knn-algorithmus-einfach-erklart\">KNN<\/a>, <a href=\"https:\/\/liora.io\/de\/was-ist-k-means\">K-means<\/a>, Random Forest, logistische Regression usw. Maschinelles Lernen (engl. Machine Learning) erm\u00f6glicht es dem Computer, aus den Daten zu lernen.<\/p>\n<p>Um eine Vorstellung davon zu bekommen, wie sehr man dem Modell vertrauen kann, durchl\u00e4uft man eine &#8222;Testphase&#8220;, in der man den Algorithmus mit einem Teil der Daten testet. Es ist wichtig, dass der Testfehler klein ist, um dem Modell vertrauen zu k\u00f6nnen. Das Testen mehrerer Algorithmen dient dazu, die Fehler zu vergleichen und die richtige Wahl zu treffen.<\/p>\n<p>Zusammenfassend l\u00e4sst sich sagen, dass ein <a href=\"https:\/\/liora.io\/de\/klassifikationsalgorithmen-definition-und-hauptmodelle\">Klassifikationsalgorithmus<\/a>, wie im einleitenden Teil erl\u00e4utert, als eine Funktion visualisiert werden kann, die in unserem Beispiel Individuen als Argumente nimmt und jedem Individuum einen Wert von 1 (krank) oder 0 (gesund) zuweist.<\/p>\n<h3>Beispiel 2: Anzahl der Passagiere<\/h3>\n<p>Ein weiteres beliebtes Beispiel f\u00fcr die pr\u00e4diktive Analyse sind Zeitreihen. Sie erm\u00f6glichen es, die Entwicklung einer Gr\u00f6\u00dfe im Laufe der Zeit darzustellen. Diese Art von Daten findet man in den Charts der B\u00f6rsenkurse. Bei der Vorhersage von Zeitreihen wird nach einem geeigneten Modell gesucht, um zuk\u00fcnftige Werte auf der Grundlage fr\u00fcher beobachteter Werte vorherzusagen.<\/p>\n<p>Die Struktur des Datasets ist unterschiedlich. Bei der Zeitreihenanalyse hat man eine zeitliche Dimension, d. h. die Daten sind chronologisch geordnet.<\/p>\n<p>Da es sich nur um zwei Variablen handelt, hier das Datum und die Anzahl der Passagiere an einem bestimmten Tag, kann man eine Visualisierung in der Ebene :<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t\t<a href=\"https:\/\/www.actuia.com\/actualite\/modelisation-et-evaluation-des-series-temporelles\/\"><br \/>\n<img decoding=\"async\" width=\"512\" height=\"318\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-11.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-11.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/unnamed-11-300x186.png 300w\" sizes=\"(max-width: 512px) 100vw, 512px\">\t\t\t\t\t\t\t\t<\/a><figcaption><\/figcaption><\/figure>\n<p>In T\u00fcrkis sehen wir die tats\u00e4chlichen Daten und in Rot haben wir die vom Modell vorgeschlagenen Sch\u00e4tzungen.<\/p>\n<p>Die Tatsache, dass die Daten nach der Zeit geordnet sind, f\u00fchrt zu einer Korrelation zwischen benachbarten Variablen. Die Untersuchung von Zeitreihen beruht auf einer Zerlegung in verschiedene Elemente (Trend, Saisonalit\u00e4t und Rauschen).<\/p>\n<h3>Fazit<\/h3>\n<p>Zusammenfassend l\u00e4sst sich sagen, dass die Vorhersagemodellierung Antworten auf eine bestimmte Fragestellung liefert und Methoden vorschl\u00e4gt, die es erm\u00f6glichen, zuk\u00fcnftiges Verhalten zu antizipieren. Es gibt viele verschiedene M\u00f6glichkeiten, Vorhersagen zu treffen, und es ist wichtig, den Kontext zu verstehen und die Fragen zu definieren, um ein Modell vorzuschlagen, das dem Kontext angepasst ist.<\/p>\n<p>Bei einer Vorhersageanalyse ist es daher unerl\u00e4sslich, Kenntnisse in Statistik zu haben, um eine geeignete Studie durchf\u00fchren und die Ergebnisse richtig interpretieren zu k\u00f6nnen.<\/p>\n<p>Wenn du dich in Statistik weiterbilden und deine technischen F\u00e4higkeiten im Zusammenhang mit diesen Themen verbessern m\u00f6chtest, dann melde dich f\u00fcr die Ausbildung zum Data Scientist an.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\"><br \/>\nEntdecke unsere Weiterbildungen<br \/>\n<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Predictive Modeling: Wie wird das Wetter morgen sein? Kann man den B\u00f6rsenkurs vorhersagen? Kann man &#8222;erraten&#8220;, ob ein Patient an einer Krankheit leiden wird oder nicht? Wie kann man das Verhalten von Kunden besser verstehen, um ihnen ein passendes Angebot zu machen? Das sind Fragen, auf die Datenwissenschaftler und Statistiker engagiert nach Antworten suchen, indem [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":181047,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-181046","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/181046","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=181046"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/181046\/revisions"}],"predecessor-version":[{"id":217357,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/181046\/revisions\/217357"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/181047"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=181046"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=181046"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}