{"id":171483,"date":"2026-01-28T13:06:30","date_gmt":"2026-01-28T12:06:30","guid":{"rendered":"https:\/\/liora.io\/de\/?p=171483"},"modified":"2026-02-06T04:28:36","modified_gmt":"2026-02-06T03:28:36","slug":"machine-learning-data-sets-top-5-websites","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/machine-learning-data-sets-top-5-websites","title":{"rendered":"Machine Learning Data Sets: TOP 4 Websites"},"content":{"rendered":"<style>\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style>\n<p><strong>Heute treffen wir uns zu einem zweiten Artikel, in dem du lernst, wie du Datens\u00e4tze (oder Datasets auf Englisch) findest, um deine Machine-Learning-Algorithmen zu trainieren, denn ja, Modelle zu erstellen ist gut, aber Daten zu finden, um diese Modelle zu trainieren, ist besser! Du hast die erste Episode: Public datasets for machine learning verpasst ? Hier kommt sie!<\/strong><\/p>\n<p>Egal, ob du dich f\u00fcr Luft- und Raumfahrt, Sport, Umwelt oder den <strong>Stra\u00dfenverkehr<\/strong> auf der Pariser Ringstra\u00dfe interessierst, finde heraus, wo und wie du die richtigen <a href=\"https:\/\/liora.io\/de\/datasets-top-5-websites-fuer-qualitativ-hochwertige-datensaetze\">Datens\u00e4tze<\/a> f\u00fcr deine Bed\u00fcrfnisse abrufen kannst.&nbsp;<\/p>\n<p>Hier findest du eine Top 5 der besten Seiten, um <a href=\"https:\/\/liora.io\/de\/open-source-definition\">Open-Source-Daten<\/a> aus dem Internet zu holen.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-1-google-dataset-search\">1 &#8211; Google Dataset Search<\/h2>\n<style>\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\n<figure>\n\t\t\t\t\t\t\t\t\t\t\t<a href=\"\/\"><br \/>\n<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/unnamed.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/unnamed.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/unnamed-300x157.png 300w\" sizes=\"(max-width: 512px) 100vw, 512px\" width=\"512\" height=\"268\">\t\t\t\t\t\t\t\t<\/a><figcaption><\/figcaption><\/figure>\n<p>Dieses von <strong>Google entwickelte Tool<\/strong> ist eine der effizientesten M\u00f6glichkeiten, ein Dataset zu finden, indem du einfach nach Stichw\u00f6rtern suchst.&nbsp;<\/p>\n<p>Beispiel: Ich m\u00f6chte ein <a href=\"https:\/\/liora.io\/de\/machine-learning-definition-funktionsweise-anwendungen\">Machine-Learning-Projekt<\/a> mit Bezug zum Tennis machen, genauer gesagt: mit Bezug zu den French Open. Warum f\u00fcge ich nicht die Leistungen von Nadal in mein Projekt ein.<br \/>\nDazu musst du nur diese drei Stichw\u00f6rter in die Suchleiste eingeben, wie bei einer einfachen Google-Suche.&nbsp;<\/p>\n<p>Die Suche gibt alle <strong>Datasets zur\u00fcck, die die gesuchten Schl\u00fcsselw\u00f6rter<\/strong> enthalten, sowie eine kurze Beschreibung und zus\u00e4tzliche Daten zu diesen Datasets (Quelle, Erscheinungsdatum, Lizenztyp, etc.).<\/p>\n<p>Du kannst deine Suche durch erweiterte Parameter verfeinern, wie z. B. das Datum der letzten Aktualisierung, die Nutzungsrechte oder schlie\u00dflich, ob das Dataset kostenlos ist.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-2-eurostat\">2 &#8211; Eurostat<\/h2>\n<p><a href=\"https:\/\/ec.europa.eu\/eurostat\/data\/database\">Diese Website der EU<\/a> stellt \u00f6ffentliche Daten zur Verf\u00fcgung. Es gibt Datens\u00e4tze zu verschiedenen Themen, bei denen man die territoriale Granularit\u00e4t (departementale, regionale, nationale Ebene), die Quelle (einige Ministerien stellen Daten zur Verf\u00fcgung) und den Zeitraum, den die Daten abdecken, angeben kann.<\/p>\n<p>Es werden viele verschiedene Themen behandelt.&nbsp;<\/p>\n<p>Es gibt beispielsweise <strong>Datasets \u00fcber Wirtschaft, Gesundheit, Landwirtschaft, Umwelt, Tourismus, Bildung oder europ\u00e4ische Themen.<\/strong><\/p>\n<p>Die Seite zeigt auch, wie die Datasets von anderen Plattformen f\u00fcr Umfragen oder Ver\u00f6ffentlichungen wiederverwendet wurden.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-3-fema-gov\">3 &#8211; Fema.gov<\/h2>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Screenshot-2020-10-20-at-10.28.17.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Screenshot-2020-10-20-at-10.28.17.png 1260w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Screenshot-2020-10-20-at-10.28.17-300x107.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Screenshot-2020-10-20-at-10.28.17-1024x367.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Screenshot-2020-10-20-at-10.28.17-768x275.png 768w\" sizes=\"(max-width: 1260px) 100vw, 1260px\" width=\"1260\" height=\"451\"><figcaption><\/figcaption><\/figure>\n<p>Die <a href=\"https:\/\/www.google.com\/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=&amp;cad=rja&amp;uact=8&amp;ved=2ahUKEwjo-LCVgM39AhUGTKQEHXJkBdIQFnoECBQQAQ&amp;url=https%3A%2F%2Fwww.fema.gov%2Fde&amp;usg=AOvVaw1DncOmoV2ZzhpH2aoAZfkf\">FEMA (Federal Emergency Management Agency)<\/a> ist eine US-amerikanische Beh\u00f6rde, die die Bev\u00f6lkerung vor Bedrohungen und Gefahren warnen und sch\u00fctzen soll, die ein Risiko auf dem Gebiet der USA darstellen.<\/p>\n<p>Die Organisation hat eine Website eingerichtet, die freien Zugang zu Datenbanken bietet, in denen Informationen zu verschiedenen Themen gesammelt werden.<\/p>\n<p>&nbsp;Die Datenbanken enthalten Informationen \u00fcber Katastrophen, die sich in den USA ereignet haben, \u00fcber die Bew\u00e4ltigung von Notsituationen, \u00fcber Hilfsprogramme f\u00fcr die Bev\u00f6lkerung und \u00fcber Haushalte, die von Programmen zur Verhinderung von Naturkatastrophen profitiert haben.<\/p>\n<p>Auf jeder Seite, die ein Dataset vorstellt, findest Du Informationen \u00fcber das Dataset und seinen Inhalt sowie Links zum Herunterladen der Daten.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-4-data-nasa-gov\">4 &#8211; Data.nasa.gov<\/h2>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/dataset-nasa.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/dataset-nasa.jpg 891w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/dataset-nasa-300x166.jpg 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/dataset-nasa-768x426.jpg 768w\" sizes=\"(max-width: 891px) 100vw, 891px\" width=\"891\" height=\"494\"><figcaption><\/figcaption><\/figure>\n<p>Die <strong>NASA<\/strong> (National Aeronautics and Space Administration) hat beschlossen, einige ihrer Datens\u00e4tze zu ver\u00f6ffentlichen, um &#8222;deine Kreativit\u00e4t bei der <strong>L\u00f6sung von Problemen<\/strong> auf der Erde anzuregen&#8220;. Die NASA hat sich dazu entschlossen, einige ihrer Datens\u00e4tze zu ver\u00f6ffentlichen, um &#8222;deine Kreativit\u00e4t bei der L\u00f6sung von Problemen auf der Erde anzuregen&#8220;.<\/p>\n<blockquote><p>Neben der Bereitstellung von Daten macht die Organisation auch Projekte von Forschern und APIs frei zug\u00e4nglich.<\/p><\/blockquote>\n<p>Wenn du <a href=\"https:\/\/nasa.github.io\/data-nasa-gov-frontpage\/\" target=\"_blank\" rel=\"noopener\">den NASA Dataset Katalog<\/a> aufrufst, kannst du nach Stichw\u00f6rtern suchen und verschiedene Filter ausw\u00e4hlen&#8230;<br \/>\nF\u00fcr jeden Datensatz hast du Zugang zu einer detaillierten Beschreibung der Spalten und einer Vorschau..<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Heute treffen wir uns zu einem zweiten Artikel, in dem du lernst, wie du Datens\u00e4tze (oder Datasets auf Englisch) findest, um deine Machine-Learning-Algorithmen zu trainieren, denn ja, Modelle zu erstellen ist gut, aber Daten zu finden, um diese Modelle zu trainieren, ist besser! Du hast die erste Episode: Public datasets for machine learning verpasst ? Hier kommt sie!<\/p>\n","protected":false},"author":47,"featured_media":171484,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-171483","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/171483","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=171483"}],"version-history":[{"count":3,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/171483\/revisions"}],"predecessor-version":[{"id":216424,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/171483\/revisions\/216424"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/171484"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=171483"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=171483"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}