{"id":183841,"date":"2023-08-18T18:41:26","date_gmt":"2023-08-18T17:41:26","guid":{"rendered":"https:\/\/liora.io\/de\/?p=183841"},"modified":"2026-02-06T06:21:01","modified_gmt":"2026-02-06T05:21:01","slug":"machine-learning-modelle-so-geht-diemodellierung-eines-machine-learning-projekts","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/machine-learning-modelle-so-geht-diemodellierung-eines-machine-learning-projekts","title":{"rendered":"Machine Learning Modelle: So geht die Modellierung eines Machine-Learning-Projekts"},"content":{"rendered":"<ul>\n<li><a style=\"color: #000000;\" href=\"\/#introduction\">Einleitung<\/a>\n<ul>\n<li><a style=\"color: #000000;\" href=\"\/#modeles\">Auswahl der Modelle<\/a>\n<ul>\n<li><a style=\"color: #000000;\" href=\"\/#types\">Arten des Lernens<\/a>\n<ul>\n<li><a style=\"color: #000000;\" href=\"\/#non supervise\">Un\u00fcberwachtes Lernen<\/a><\/li>\n<li><a style=\"color: #000000;\" href=\"\/#supervise\">\u00dcberwachtes Lernen<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li><a style=\"color: #000000;\" href=\"\/#selection\">Modellauswahl und -optimierung<\/a><\/li>\n<li><a style=\"color: #000000;\" href=\"\/#metrique\">Metrik<\/a><\/li>\n<li><a style=\"color: #000000;\" href=\"\/#finalisation\">Abschluss<\/a><\/li>\n<\/ul>\n<\/li>\n<li><a style=\"color: #000000;\" href=\"\/#conclusion\">Fazit<\/a><\/li>\n<\/ul>\n<h3>Einleitung<\/h3>\n<p>Du hast wahrscheinlich schon von <a href=\"https:\/\/liora.io\/de\/survival-analysis-mehr-als-nur-machine-learning\">Machine Learning<\/a> geh\u00f6rt, wenn es um die Vorhersage des Preises eines Hauses oder um Sportwetten geht. Die Einsatzm\u00f6glichkeiten sind vielf\u00e4ltig und du fragst dich wahrscheinlich, wie du sie f\u00fcr solche Projekte nutzen kannst.<br \/>\nIn den vorherigen Artikeln haben wir \u00fcber die Einrichtung einer geeigneten Umgebung und die Erforschung der notwendigen Daten gesprochen, bevor wir uns an die <a href=\"https:\/\/liora.io\/de\/q-learning-machine-learning-mit-verstaerkendem-lernen\">Modellierung eines ML-Projekts machen<\/a>. Falls du sie noch nicht gelesen hast, empfehlen wir dir, dies zu tun, bevor du mit der Modellierung beginnst.<br \/>\nHeute geht es darum, wie du die Schritte zur Modellierung des Projektproblems organisieren kannst.<\/p>\n<h4>Auswahl der Modelle<\/h4>\n<p>Wenn du die Schritte des vorherigen Artikels befolgt hast, sollten dein <a href=\"https:\/\/liora.io\/de\/datasets-top-5-websites-fuer-qualitativ-hochwertige-datensaetze\">Datensatz<\/a> und deine Produktionsumgebung f\u00fcr die Modellierung bereit sein.<\/p>\n<p>Beginnen wir damit, das Problem zu modellieren, d. h. die Problemstellung in eine bestimmte Aufgabe umzuwandeln.<\/p>\n<h5>Arten des Lernens<\/h5>\n<p>Wir unterscheiden zwei Hauptfamilien im Bereich des ML: <a href=\"https:\/\/liora.io\/de\/supervised-learning-5-wichtige-punkte\">\u00fcberwachtes und un\u00fcberwachtes Lernen.<\/a><\/p>\n<p>Anmerkung: Es gibt auch andere Arten des Lernens, wie z. B. das <strong>halb\u00fcberwachte Lernen oder das Lernen durch Verst\u00e4rkung<\/strong>, die wir in diesem Artikel nicht n\u00e4her erl\u00e4utern werden.<\/p>\n<p>Die Frage, die du dir stellen musst, um herauszufinden, zu welcher Familie dein Problem geh\u00f6rt, ist folgende: Besitzt du die Zielvariable f\u00fcr mein Projekt?<\/p>\n<p>Deine Zielvariable ist die Spalte, die du vorhersagen willst. Wenn du die Werte dieser Spalte besitzt, bist du in einem \u00fcberwachten Lernprozess.<\/p>\n<p>Wenn du nicht \u00fcber die Werte verf\u00fcgst, sondern versuchst, eine Sch\u00e4tzung der Spalte zu erhalten, ohne die genauen Werte zu kennen, handelt es sich um un\u00fcberwachtes Lernen.<\/p>\n<h6><b>1) Nicht \u00fcberwachtes Lernen<\/b><\/h6>\n<p>Beim unbeaufsichtigten Lernen musst du die folgenden Techniken anwenden:<\/p>\n<ul>\n<li><a href=\"https:\/\/liora.io\/de\/machine-learning-clustering\">Clustering<\/a> (Kmeans, MeanShift, Spectral Clustering&#8230;).<\/li>\n<li><a href=\"https:\/\/liora.io\/de\/t-sne-algorithmus\">Algorithmen zur Dimensionsreduktion (PCA, TSNE).<\/a><\/li>\n<li>Die Erkennung von Anomalien (EllipticEnvelope, <a href=\"https:\/\/liora.io\/de\/isolation-forest\">IsolationForest<\/a>).<\/li>\n<\/ul>\n<p>Brauchst du eine kleine Auffrischung zu diesen Themen? Sie werden alle in unserem Blog behandelt.<\/p>\n<p>Kommen wir nun zum \u00fcberwachten Lernen.<\/p>\n<h6><b>2) \u00dcberwachtes Lernen<\/b>.<\/h6>\n<p>Wenn dein Datensatz hingegen die Zielvariable enth\u00e4lt, dann musst du dich fragen, ob die Spalte, die du vorhersagen willst, eine<strong> kontinuierliche oder eine kategoriale Variable ist.<\/strong><\/p>\n<p>Eine kontinuierliche Variable ist z. B. der Preis eines Hauses oder die Zeit, die eine Person auf einer Website verbringt, bevor sie zum Kauf \u00fcbergeht.<\/p>\n<p>Eine kategoriale Variable hingegen hat eine begrenzte Anzahl von Modalit\u00e4ten, wie z. B. eine Altersgruppe oder die verschiedenen Arten von Treueabonnements einer bestimmten Telefongesellschaft.<\/p>\n<p>Es gibt viele verschiedene Regressionsalgorithmen. Zu nennen sind hier die lineare Regression, <a href=\"https:\/\/liora.io\/de\/random-forest-definition\">Random Forests<\/a> oder SVM Regressor.<\/p>\n<p>Es gibt auch viele Klassifikationsalgorithmen wie Entscheidungsb\u00e4ume oder das SVM-Modell.<\/p>\n<p>Wenn du das Gef\u00fchl hast, dass eine Auffrischung dieser Algorithmen hilfreich w\u00e4re, haben wir ihnen einen Artikel in unserem Blog gewidmet, den du dir gerne ansehen kannst.<\/p>\n<p>In beiden F\u00e4llen gibt es keine Zauberformel, sondern du musst zun\u00e4chst die<strong> verschiedenen Modelle testen,<\/strong> um dasjenige zu bestimmen, das dir die beste Leistung bringt.<\/p>\n<p>Wenn du jedoch eine Klassifikation durchf\u00fchrst und deine Klassen unausgewogen sind, ist es ratsam, deinen Datensatz mithilfe von Resampling-Techniken wieder ins Gleichgewicht zu bringen.<\/p>\n<p><img decoding=\"async\" width=\"764\" height=\"384\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image4.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image4.png 764w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image4-300x151.png 300w\" sizes=\"(max-width: 764px) 100vw, 764px\"><\/p>\n<p>Deep-Models und neuronale Netze k\u00f6nnen sowohl bei der Regression als auch bei der Klassifizierung eingesetzt werden. Sie bieten oftmals eine h\u00f6here Leistung, haben aber auch zwei Nachteile, die es zu beachten gilt.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/neuronale-netze-einfach-erklaert\">Neuronale Netze<\/a> sind sehr anf\u00e4llig f\u00fcr Overlearning (d. h. sie sind schwer zu verallgemeinern) und sind nicht gut interpretierbar. Mit interpretierbar ist gemeint, dass es komplex ist, ihre Entscheidungen zu verstehen und zu antizipieren.<\/p>\n<h4>Auswahl und Optimierung der Vorlage<\/h4>\n<p>Du hast jetzt die Leistung jedes Modells, das f\u00fcr dein Problem in Frage kommt. Du musst nun das Modell mit der besten Leistung ausw\u00e4hlen, aber wie?<\/p>\n<p>Die <a href=\"https:\/\/liora.io\/de\/kreuzvalidierungsverfahren-definition-und-bedeutung-fur-machine-learning\">Kreuzvalidierung ist eine sehr n\u00fctzliche Technik,<\/a> mit der du herausfinden kannst, ob dein Modell verallgemeinerbar ist, d. h., ob es sich gut verh\u00e4lt, wenn es auf neue Daten trifft.<\/p>\n<p>Sie erm\u00f6glicht es dir auch, die optimalen Parameter deines Modells parallel zur Optimierungsmethode zu finden. Es gibt verschiedene Methoden zur Optimierung von Hyperparametern, wie z. B. die `GridSearchCV`-Funktion, die Zufallssuche oder die Bayes&#8217;sche Optimierung&#8230;<\/p>\n<h4>Metrisch<\/h4>\n<p>Die Leistung von Akkordmodellen erhalten, aber nach welcher Metrik?<\/p>\n<p>F\u00fcr <a href=\"https:\/\/liora.io\/de\/logistische-regression-was-ist-das-denn\">Regressionsprobleme<\/a> kannst du die Metriken MAE, MSE oder R2 in Betracht ziehen.<\/p>\n<p>Bei Klassifikationsproblemen kannst du die Werkzeuge der Konfusionsmatrix oder des Klassifikationsberichts verwenden.<\/p>\n<p>Die <a href=\"https:\/\/liora.io\/de\/confusion-matrix\">Konfusionsmatrix<\/a> ist eine praktische Darstellung der Genauigkeit eines Modells mit zwei oder mehr Klassen, w\u00e4hrend der Klassifikationsbericht mehr Informationen \u00fcber andere Metriken (z. B. Recall, f1-Score usw.) liefert.<\/p>\n<p><img decoding=\"async\" width=\"315\" height=\"90\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image2-1.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image2-1.png 315w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image2-1-300x86.png 300w\" sizes=\"(max-width: 315px) 100vw, 315px\"><br \/>\n<img decoding=\"async\" width=\"638\" height=\"176\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image3.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image3.png 638w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image3-300x83.png 300w\" sizes=\"(max-width: 638px) 100vw, 638px\"><br \/>\n<img decoding=\"async\" width=\"291\" height=\"153\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image1-1-1.png\" alt=\"\" loading=\"lazy\"><\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"512\" height=\"384\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image5-2.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image5-2.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/image5-2-300x225.png 300w\" sizes=\"(max-width: 512px) 100vw, 512px\"><figcaption><\/figcaption><\/figure>\n<h4>Abschluss<\/h4>\n<p>Zu diesem Zeitpunkt hast du die Leistung deiner verschiedenen Modelle in deinem Datensatz mit den<strong> hyperoptimalen Parametern<\/strong> und der\/den Bewertungsmetrik(en). Du kannst nun die Leistung der Modelle vergleichen und dich auf das beste Modell einigen.<\/p>\n<p>Um dies zu tun, solltest du nicht nur die Leistung des Modells ber\u00fccksichtigen, sondern auch die Interpretierbarkeit hinterfragen. In einigen Bereichen, wie z. B. in der Medizin oder beim autonomen Fahren, kann es entscheidend sein, zu verstehen, wie dein Modell seine Entscheidungen trifft. Diese beiden Aspekte m\u00fcssen ber\u00fccksichtigt werden, um den besten Kompromiss zu finden und das am besten geeignete Modell zu finden.<\/p>\n<h3>Fazit<\/h3>\n<p>Jetzt wei\u00dft du, wie du die verschiedenen Schritte der Modellierung deines Projekts durchf\u00fchren kannst.<\/p>\n<p>Wenn dir dieser oder die anderen Artikel gefallen haben, dann <a href=\"https:\/\/www.youtube.com\/watch?v=ugALxRuTh00&amp;t=139s\">abonniere unseren YouTube-Kanal<\/a>, um \u00fcber Themen der Data Science informiert zu werden, die dich interessieren k\u00f6nnten.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Einleitung Auswahl der Modelle Arten des Lernens Un\u00fcberwachtes Lernen \u00dcberwachtes Lernen Modellauswahl und -optimierung Metrik Abschluss Fazit Einleitung Du hast wahrscheinlich schon von Machine Learning geh\u00f6rt, wenn es um die Vorhersage des Preises eines Hauses oder um Sportwetten geht. Die Einsatzm\u00f6glichkeiten sind vielf\u00e4ltig und du fragst dich wahrscheinlich, wie du sie f\u00fcr solche Projekte nutzen [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":183829,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-183841","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/183841","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=183841"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/183841\/revisions"}],"predecessor-version":[{"id":217227,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/183841\/revisions\/217227"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/183829"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=183841"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=183841"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}