{"id":185568,"date":"2023-09-16T18:26:19","date_gmt":"2023-09-16T17:26:19","guid":{"rendered":"https:\/\/liora.io\/de\/?p=185568"},"modified":"2026-02-06T06:16:25","modified_gmt":"2026-02-06T05:16:25","slug":"google-cloud-data-catalog-wie-man-seine-daten-besser-verwaltet","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/google-cloud-data-catalog-wie-man-seine-daten-besser-verwaltet","title":{"rendered":"Google Cloud Data Catalog: Wie man seine Daten besser verwaltet"},"content":{"rendered":"<p><strong>Google Cloud Data Catalog: In Zeiten von Big Data und steigenden Datenmengen brauchen moderne Unternehmen mehr denn je eine effiziente Datenverwaltung. An dieser Stelle kommt der Datenkatalog von GCP ins Spiel.<\/strong><\/p>\nWorum geht es also? Warum sollte man es benutzen? Wie funktioniert es? Das werden wir uns in diesem Artikel ansehen.\n<h3>Was ist der Google Cloud Data Catalog?<\/h3>\nDer<strong> Google Cloud Data Catalog<\/strong> ist ein Dienst zur Verwaltung von Metadaten, der zu Dataplex geh\u00f6rt. Zur Erinnerung: Metadaten sind die Daten der Daten.\n\nDie Idee ist, den verschiedenen verf\u00fcgbaren Daten einen Kontext zu geben, indem man die Fragen beantwortet: <em>Wer? Was? Wo? Wie? Warum?<\/em>\n\nDadurch wird es f\u00fcr Organisationen einfacher, die Daten zu identifizieren, die sie ben\u00f6tigen.\n<h3>Warum den Google Cloud Data Catalog verwenden?<\/h3>\nDer <strong>Google Cloud Data Catalog<\/strong> tr\u00e4gt voll und ganz zur effektiven Datenverwaltung f\u00fcr Unternehmen bei. Und das aus mehreren Gr\u00fcnden.\n<h4>Die Qualit\u00e4t der Daten<\/h4>\nDer&nbsp;<strong>Google Cloud Data Catalog<\/strong> ist Teil der Einf\u00fchrung von <a href=\"https:\/\/liora.io\/de\/data-governance-bilde-dich-weiter-und-bleibe-am-puls-der-zeit\">Data Governance<\/a>. Die Idee dahinter ist, die Zuverl\u00e4ssigkeit und Relevanz der verf\u00fcgbaren Informationen durch die Festlegung eines Rahmens zu gew\u00e4hrleisten.\n\nZu diesem Zweck f\u00fchrt die <a href=\"https:\/\/liora.io\/de\/data-governance-tools\">Data Governance einen Prozess f\u00fcr die Datenbereinigung,<\/a> -umwandlung, -aktualisierung, -suche, -eigenschaft usw. ein. F\u00fcr jeden Schritt in diesem Prozess ben\u00f6tigen die Datenexperten mehrere Werkzeuge. Dazu geh\u00f6rt auch der Datenkatalog.\n<h4>Die zentrale Verwaltung der Datenressourcen<\/h4>\nDer <strong>Google Cloud Data Catalog<\/strong> fasst alle Daten einer Organisation zusammen. Dabei spielt es keine Rolle, woher die Daten stammen: Datenseen, Data Warehouses, Webseiten, Dienste von Drittanbietern etc.\n\nDas bedeutet, dass die Mitarbeiter nicht mehr hin und her laufen m\u00fcssen, um die Informationen zu finden, die sie brauchen. Stattdessen k\u00f6nnen sie einfach den <a href=\"https:\/\/liora.io\/de\/records-management-eine-schluesselfunktion-der-data-governance\">Datenkatalog durchsuchen.<\/a>\n\nDurch die Definition eines gemeinsamen Vokabulars, die Aufhebung der Trennung von Daten und einen zentralen Speicherort erleichtert der <strong>Google Cloud-Datenkatalog<\/strong> die Zusammenarbeit zwischen den verschiedenen Mitgliedern einer Organisation (selbst wenn sie nicht in derselben Abteilung oder Region arbeiten).\n<h4>Suchen und Finden von Daten<\/h4>\nAngesichts der immer gr\u00f6\u00dfer werdenden Datenmengen ist es oft schwierig, die <strong>relevanten Informationen zum richtigen Zeitpunkt zu finden.<\/strong>\n\nDie Nutzer wissen nicht unbedingt, wo sich die Daten befinden, woher sie stammen oder wie sie n\u00fctzlich sind, da es keine entsprechende Dokumentation gibt. Genau an diesem Punkt setzt der<strong> Datenkatalog von GCP an.<\/strong>\n\n?Gut zu wissen: Dataplex integriert die Funktionen f\u00fcr k\u00fcnstliche Intelligenz und maschinelles Lernen der<strong> Google Cloud Data Catalog.<\/strong>\n\nDadurch k\u00f6nnen alle Prozesse des Datenmanagements automatisiert werden: Von der Entdeckung \u00fcber die Sammlung oder das Lebenszyklusmanagement bis hin zur R\u00fcckverfolgbarkeit der Daten. Dadurch optimiert der <strong>Google Cloud Data Catalog <\/strong>die Suche und senkt so die Kosten f\u00fcr die Verwaltung.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"900\" height=\"500\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_1.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_1.png 900w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_1-300x167.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_1-768x427.png 768w\" sizes=\"(max-width: 900px) 100vw, 900px\"><figcaption><\/figcaption><\/figure>\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Entdecke unsere Kurse<\/a><\/div><\/div>\n\n<h4>Zeitersparnis<\/h4>\nOhne ein effektives Datenmanagement m\u00fcssen Datenanalysten (oder andere Datennutzer) die <a href=\"https:\/\/liora.io\/de\/weiterbildung-data-engineer\">Data Engineers<\/a> immer wieder auffordern, ihnen die relevanten Informationen zu liefern.\n\nDiese Arbeit ist jedoch extrem zeitaufwendig, und Unternehmen verf\u00fcgen nur selten \u00fcber ausreichende Ressourcen.\n\nGl\u00fccklicherweise macht es der <strong>Google Cloud Data Catalog<\/strong> einfach, Daten zur Selbstbedienung bereitzustellen.\n\nSo kann jeder Nutzer direkt auf die ben\u00f6tigten Informationen zugreifen, ohne einen Vermittler einschalten zu m\u00fcssen.\n<h4>Ein vollst\u00e4ndig verwalteter und skalierbarer Katalog<\/h4>\nDer <strong>Datenkatalog von GCP<\/strong> erf\u00fcllt alle deine Anforderungen, unabh\u00e4ngig von der Menge der verf\u00fcgbaren Daten oder der Anzahl der Nutzer.\n\nDie <strong>Metadatenverwaltung hilft Unternehmen,<\/strong> ihre Daten besser zu nutzen.\n\nDa die Daten besser organisiert sind, k\u00f6nnen die Mitarbeiter die Informationen, die sie ben\u00f6tigen, leichter finden. Dadurch k\u00f6nnen sie bessere<strong> Entscheidungen<\/strong> treffen. Aber auch schneller, da die Daten f\u00fcr alle Mitarbeiter leichter zug\u00e4nglich sind.\n<h3>Welche Funktionen hat der Google Cloud Data Catalog?<\/h3>\n<h4>Organisation und Klassifizierung von Daten<\/h4>\nDas Hauptziel des<strong> Google Cloud Data Catalog<\/strong> ist es, die Organisation und Klassifizierung von Daten zu erleichtern. Um dies zu erreichen, k\u00f6nnen Unternehmen Metadaten definieren, die den Kontext angeben und die Suche erleichtern.\n\nDu solltest wissen, dass der <strong>GCP-Katalog<\/strong> zwei Arten von Metadaten verwaltet:\n<ul>\n \t<li><strong>Technische Metadaten:<\/strong> Dies sind z. B. die Metadaten, die mit einer Big Query-Tabelle verkn\u00fcpft sind. In diesem Fall beinhalten die Metadaten mehrere Attribute, wie z. B. den Namen und die ID des Projekts, Ressourcenbezeichnungen, Beschreibungen von Tabellen und Ansichten usw.<\/li>\n \t<li><strong>Kommerzielle Metadaten:<\/strong> Diese beinhalten Tags, Administratoren und Rich Text.<\/li>\n<\/ul>\n<h4>Integration mit den Diensten der Google Cloud Platform<\/h4>\nDa der Datenkatalog ein Dienst der Google Cloud Platform ist, integriert er sich nahtlos in die anderen Dienste von GCP. So ruft er automatisch Informationen aus einer Vielzahl von GCP-Diensten ab. Dazu geh\u00f6ren:\n<ul>\n \t<li><a href=\"https:\/\/liora.io\/de\/google-bigquery-alles-ueber-dieses-data-warehouse\">Big Query ;<\/a><\/li>\n \t<li><a href=\"https:\/\/liora.io\/de\/gcp-dataflow-was-ist-das-wozu-dient-es\">Dataflow ;<\/a><\/li>\n \t<li>Pub\/Sub ;<\/li>\n \t<li>Cloud Storage ;<\/li>\n \t<li>Analytics Hub ;<\/li>\n \t<li>Dataproc Metastore ;<\/li>\n \t<li>Dataplex-Dienste <a href=\"https:\/\/liora.io\/de\/data-lake-vs-data-warehouse-was-sind-die-unterschiede\">(Data Lakes<\/a>, Zonen, Tabellen und Dateisets).<\/li>\n<\/ul>\nAber auch Daten von anderen Diensten \u00fcber APIs, wie <a href=\"https:\/\/liora.io\/de\/apache-hadoop-hive-sql-fuer-die-entscheidungsfindung\">Hive,<\/a> Oracle, SQL server, Teradata, Redshift, <a href=\"https:\/\/liora.io\/de\/mysql-eine-relationale-datenverwaltungssoftware\">MySQL<\/a>, PostgreSQL, Looker oder Tableau.\n<h4>Datensicherheit und -konformit\u00e4t<\/h4>\nDer <strong>Google Cloud Data Catalog&nbsp;<\/strong>erleichtert nicht nur den Zugriff auf die Daten, sondern stellt auch sicher, dass die Nutzer mit konformen Daten versorgt werden.\n\nDie Plattform verwaltet den <strong>Datenzugriff durch die Kontrolle von Zugriffsrechten<\/strong> und die Verfolgung von Datenaktivit\u00e4ten. Die Plattform verteilt dann das Eigentum an den Daten entsprechend den Zugriffsrechten der einzelnen Nutzer.\n\nNeben der Kontrolle der Zugriffsberechtigungen stellt <strong>Google Cloud Data Catalog<\/strong> auch sicher, dass die Nutzung der Daten mit den geltenden Vorschriften wie der <a href=\"https:\/\/liora.io\/de\/dsgvo-definition-und-auswirkungen-auf-unternehmen\">DSGVO \u00fcbereinstimmt.<\/a>\n\nUnd da die Daten im Datenkatalog zentralisiert sind, ist es einfacher, die Gesamtsicherheit der Daten zu gew\u00e4hrleisten.\n<h3>Google Cloud Data Catalog: Datenverwaltung optimieren<\/h3>\nDer <strong>Google Cloud Data Catalog<\/strong> ist eines der wichtigsten Werkzeuge f\u00fcr eine effektive Datenverwaltung. Aber er ist nicht das einzige. Data Engineers und Data Analysts haben eine Vielzahl von L\u00f6sungen, um Daten zu organisieren und ihre Nutzung zu optimieren.\n\nM\u00f6chtest du sie entdecken?\n\n<strong>Komme zu Liora!<\/strong> Du lernst nicht nur die wichtigsten Werkzeuge kennen, sondern auch die richtigen Arbeitsmethoden, um deine Daten besser zu verwalten und Organisationen dabei zu helfen, bessere Entscheidungen zu treffen.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"900\" height=\"500\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_2.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_2.png 900w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_2-300x167.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/09\/data_catalog_gcp_2-768x427.png 768w\" sizes=\"(max-width: 900px) 100vw, 900px\">\n\n<figcaption><\/figcaption><\/figure>\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Entdecke unsere Kurse<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Google Cloud Data Catalog: In Zeiten von Big Data und steigenden Datenmengen brauchen moderne Unternehmen mehr denn je eine effiziente Datenverwaltung. An dieser Stelle kommt der Datenkatalog von GCP ins Spiel. Worum geht es also? Warum sollte man es benutzen? Wie funktioniert es? Das werden wir uns in diesem Artikel ansehen. Was ist der Google [&hellip;]<\/p>\n","protected":false},"author":78,"featured_media":185569,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-185568","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/185568","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/78"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=185568"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/185568\/revisions"}],"predecessor-version":[{"id":217170,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/185568\/revisions\/217170"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/185569"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=185568"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=185568"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}