{"id":178018,"date":"2023-06-10T11:16:37","date_gmt":"2023-06-10T10:16:37","guid":{"rendered":"https:\/\/liora.io\/de\/?p=178018"},"modified":"2026-02-06T06:41:20","modified_gmt":"2026-02-06T05:41:20","slug":"cuml-definition-und-verwendung-in-machine-learning","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/cuml-definition-und-verwendung-in-machine-learning","title":{"rendered":"cuML: Definition und Verwendung in Machine Learning"},"content":{"rendered":"Wenn wir es mit gro\u00dfen<strong> Datenbest\u00e4nden<\/strong> mit enorm vielen Beobachtungen und komplexen <a href=\"https:\/\/liora.io\/de\/tpot-alles-ueber-diese-python-bibliothek-fuer-machine-learning\">Machine-Learning-Modellen<\/a> mit vielen Hyperparametern zu tun haben, kann der Trainingsschritt mehrere Stunden dauern. In diesem Fall entsteht eine inverse Beziehung zwischen der Anzahl der Daten und der Leistung des Modells. Um also diese verlorene Zeit, die durch das Warten auf die Ausf\u00fchrung der Algorithmen verloren geht, zu reduzieren und diesen Leistungsabfall zu vermeiden, scheint <strong>cuML<\/strong> die L\u00f6sung zu sein!\n\n?Auch interessant:\n<table dir=\"ltr\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<colgroup>\n<col width=\"268\"><\/colgroup>\n<tbody>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Bagging im Machine Learning - Was ist das ?&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/bagging-im-machine-learning-was-ist-das\"><a href=\"https:\/\/liora.io\/de\/bagging-im-machine-learning-was-ist-das\" target=\"_blank\" rel=\"noopener\">Bagging im Machine Learning &#8211; Was ist das ?<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Machine Learning Clustering: CAH Algorithmus&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/machine-learning-clustering-fokus-auf-den-cah-algorithmus\"><a href=\"https:\/\/liora.io\/de\/machine-learning-clustering-fokus-auf-den-cah-algorithmus\" target=\"_blank\" rel=\"noopener\">Machine Learning Clustering: CAH Algorithmus<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Deep Learning vs. Machine Learning&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/deep-learning-vs-machine-learning\"><a href=\"https:\/\/liora.io\/de\/deep-learning-vs-machine-learning\" target=\"_blank\" rel=\"noopener\">Deep Learning vs. Machine Learning<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Data Poisoning&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/data-poisoning-eine-bedrohung-fuer-machine-learning-modelle\"><a href=\"https:\/\/liora.io\/de\/data-poisoning-eine-bedrohung-fuer-machine-learning-modelle\" target=\"_blank\" rel=\"noopener\">Data Poisoning<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Machine Learning Data Sets Top 5&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/machine-learning-data-sets-top-5-websites\"><a href=\"https:\/\/liora.io\/de\/machine-learning-data-sets-top-5-websites\" target=\"_blank\" rel=\"noopener\">Machine Learning Data Sets Top 5<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h3>Was ist cuML ?<\/h3>\ncuML ist eine <a href=\"https:\/\/liora.io\/de\/open-source-definition\">OpenSource-API f\u00fcr Algorithmen<\/a>. Sie ist Teil der RAPIDS-Pakete, deren Hauptmerkmal die Verwendung von Grafikprozessoren (GPUs) f\u00fcr alle <a href=\"https:\/\/liora.io\/de\/klassifikationsalgorithmen-definition-und-hauptmodelle\">Algorithmenstrukturen<\/a> ist, nicht nur f\u00fcr neuronale Netze, wie es normalerweise der Fall ist. Genauer gesagt verwendet cuML einen beschleunigten Grafikprozessor, der die Leistung einer herk\u00f6mmlichen CPU (Central Processing Unit) bei einfachen Machine-Learning-Algorithmen um das Vierfache und bei komplexeren Algorithmen um das Tausendfache steigern kann.\n\nDadurch ist es eine echte Alternative zu <a href=\"\/\">Scikit-Learn.<\/a> Scikit-Learn ist eine Python-Bibliothek, die zwar vollst\u00e4ndig ist und h\u00e4ufig in der Datenwissenschaft eingesetzt wird, aber f\u00fcr <a href=\"https:\/\/liora.io\/de\/big-data-definition-technologien-anwendungen-weiterbildung\">Big Data<\/a> nicht sehr schnell ist.\n\nNehmen wir ein Beispiel, um die Ausf\u00fchrungszeit der beiden Bibliotheken zu vergleichen. Wir haben den <strong>Titanic-Datensatz,<\/strong> der auf <a href=\"https:\/\/liora.io\/de\/kaggle-alles-was-du-ueber-diese-plattform-wissen-musst\">Kaggle<\/a> verf\u00fcgbar ist, mit 8000 multipliziert, um einen Datensatz mit mehr als sieben Millionen Beobachtungen zu erhalten. Wir m\u00f6chten eine bin\u00e4re Klassifikation durchf\u00fchren, um vorherzusagen, ob ein Passagier der Titanic \u00fcberlebt oder nicht.\n\nMit Scikit-Learn dauert es 143 Sekunden, bis ein <a href=\"https:\/\/liora.io\/de\/random-forest-definition\">Random-Forest-Modell<\/a> auf dem vergr\u00f6\u00dferten Datenframe trainiert ist. Mit cuML betr\u00e4gt die Trainingszeit f\u00fcr ein Random-Forest-Modell auf demselben Datenrahmen nur 1,6 Sekunden. Dies beweist, wie viel effizienter und schneller cuML bei einem Data-Science-Projekt arbeitet!\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/04\/image1-5.png\" title=\"\" alt=\"\" loading=\"lazy\"><figcaption><\/figcaption><\/figure>\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">cuML lernen<\/a><\/div><\/div>\n\n<h3>Wie verwendet man cuML ?<\/h3>\n<ol>\n \t<li aria-level=\"1\"><strong>Installation:<\/strong> cuML ist Teil der RAPIDS API Suite. Du musst es \u00fcber den RAPIDS Release Selector installieren, der \u00fcber diesen Link aufgerufen werden kann, und cuML und die Optionen, die mit dem verwendeten Rechner kompatibel sind, ankreuzen.<\/li>\n \t<li aria-level=\"1\"><strong>Benutzung:<\/strong> Die API von cuML ist der von Scikit-Learn sehr \u00e4hnlich, was sie einfach zu benutzen macht. Sie enth\u00e4lt statistische Werkzeuge, Preprocessing Scaler und Methoden zum Tuning von Hyperparametern, die auf die gleiche Weise definiert sind.<\/li>\n \t<li aria-level=\"1\">F\u00fcr die Modellierung nimmst du einfach das Modell aus der cuML-Bibliothek, \u00fcbergibst ihm die Hyperparameter als Argument und benutzt die Methode .fit(), um es zu trainieren.<\/li>\n \t<li aria-level=\"1\">Weiter geht es mit dem<strong> Titanic-Problem<\/strong>. Um das Modell Random Forest mit 200 B\u00e4umen zu trainieren, verwenden wir den folgenden Code:<\/li>\n<\/ol>\n<p style=\"padding-left: 40px;\"><strong>Dieser Code sieht gut aus wie der, den wir mit Scikit-Learn geschrieben h\u00e4tten:<\/strong><\/p>\n\n<h3>Wie gut sind die Vorhersagen?<\/h3>\n<strong>cuML<\/strong> ist daher f\u00fcr Kenner von Scikit-Learn einfach zu benutzen und \u00fcbertrifft diese Bibliothek sogar in Bezug auf die Geschwindigkeit.\n\nIn Bezug auf die Leistung scheint sie ebenso effizient zu sein.\n\nOb Regression, Klassifizierung oder Clustering, es wurde nachgewiesen, dass die<strong> Modelle von cuML<\/strong> in der Regel genauso gute Vorhersageergebnisse erzielen wie die von Scikit-Learn. Es ist sogar m\u00f6glich, eine Reihe von Hyperparametern zu testen, um ein optimales Modell zu erhalten, Feature Selection zu betreiben und die Modelle zu interpretieren.\n\nSomit scheint <strong>cuML<\/strong> die ideale L\u00f6sung f\u00fcr die Verarbeitung gro\u00dfer Datenbanken oder sich st\u00e4ndig \u00e4ndernder Daten zu sein. Im Gegensatz zu Scikit-Learn, das zeitlich nicht konkurrenzf\u00e4hig ist, und Spark, das auf einer herk\u00f6mmlichen CPU basiert, nutzt cuML die Funktionen eines beschleunigten Grafikprozessors. Dies erm\u00f6glicht es, komplexe Modelle in k\u00fcrzerer Zeit zu optimieren!\n\nJetzt, da du alles \u00fcber cuML wei\u00dft, m\u00f6chtest du es vielleicht in deinen Datenprojekten anwenden. Liora l\u00e4dt dich dazu ein, unsere Datenschulungen zu besuchen.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-machine-learning-engineer\">Machine Learning Engineer Weiterbildung<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Wenn wir es mit gro\u00dfen Datenbest\u00e4nden mit enorm vielen Beobachtungen und komplexen Machine-Learning-Modellen mit vielen Hyperparametern zu tun haben, kann der Trainingsschritt mehrere Stunden dauern. In diesem Fall entsteht eine inverse Beziehung zwischen der Anzahl der Daten und der Leistung des Modells. Um also diese verlorene Zeit, die durch das Warten auf die Ausf\u00fchrung der [&hellip;]<\/p>\n","protected":false},"author":74,"featured_media":178019,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-178018","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/178018","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/74"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=178018"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/178018\/revisions"}],"predecessor-version":[{"id":217465,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/178018\/revisions\/217465"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/178019"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=178018"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=178018"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}