{"id":179201,"date":"2026-01-28T16:58:41","date_gmt":"2026-01-28T15:58:41","guid":{"rendered":"https:\/\/liora.io\/de\/?p=179201"},"modified":"2026-02-23T14:29:40","modified_gmt":"2026-02-23T13:29:40","slug":"aws-glue-was-ist-das-wozu-dient-es","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/aws-glue-was-ist-das-wozu-dient-es","title":{"rendered":"AWS Glue: Was ist das? Wozu dient es?"},"content":{"rendered":"\n<p><strong>AWS Glue ist ein vollst\u00e4ndig verwalteter und skalierbarer Datenverarbeitungsdienst, der es den Nutzern erm\u00f6glicht, serverlose ETL-Workflows (Extract, Transform, Load) zu verwenden und so den gesamten Verwaltungsteil der zugrunde liegenden Infrastruktur zu umgehen.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-erinnerung-an-etl-prozesse\">Erinnerung an ETL-Prozesse<\/h2>\n\n\n\n<p><strong>ETL<\/strong> ist ein Prozess, der darauf abzielt, die Qualit\u00e4t und Verf\u00fcgbarkeit der Daten zu gew\u00e4hrleisten. Er ist in drei Phasen unterteilt:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Extraktion<\/strong>: Abrufen von Daten aus verschiedenen Quellen.<\/li>\n\n\n\n<li><strong>Transformation<\/strong>: Bereinigung, Normalisierung, Ver\u00e4nderung der Daten, um sie nutzbar zu machen.<\/li>\n\n\n\n<li><strong>Laden<\/strong>: L\u00e4dt die umgewandelten Daten in eine Endumgebung, z. B. eine Datenbank oder ein Data Warehouse.<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image3-5-e1681996722906.png\" alt=\"\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-wie-ist-aws-glue-aufgebaut\">Wie ist AWS Glue aufgebaut?<\/h2>\n\n\n\n<p>AWS Glue-Jobs erledigen das, was n\u00f6tig ist, um Daten von einer Quelle zu einem Ziel zu extrahieren, umzuwandeln und zu laden. Das folgende Diagramm zeigt die Architektur von AWS Glue, und wir beschreiben dann die verschiedenen Elemente:<\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image1-7-1.png\" alt=\"\" style=\"width:1000px;height:auto\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Data Catalog (Datenkatalog):<\/strong> Dies ist der permanente Metadatenspeicher in AWS Glue. Er enth\u00e4lt u. a. Tabellendefinitionen, Jobdefinitionen usw.<\/li>\n\n\n\n<li><strong>Datenbank:<\/strong> Dies ist ein Satz von Tabellendefinitionen von zugeh\u00f6rigen Datenkatalogen.<\/li>\n\n\n\n<li><strong>Crawler:<\/strong> Das ist ein Programm, das sich mit einer <a href=\"https:\/\/liora.io\/de\/data-source-definition-und-details-zu-ihrer-funktionsweise\">Datenquelle verbindet<\/a>, um deren Daten zu extrahieren und ihre Struktur zu bestimmen. Anschlie\u00dfend verwendet es diese Informationen, um Tabellendefinitionen im Datenkatalog zu erstellen.<\/li>\n\n\n\n<li><strong>Verbindung:<\/strong> Diese <a href=\"https:\/\/aws.amazon.com\/de\/glue\/\">AWS Glue-Verbindung<\/a> ist der Datenkatalog, der die Informationen enth\u00e4lt, die notwendig sind, um sich mit einem bestimmten Datenspeicher zu verbinden.<\/li>\n\n\n\n<li><strong>Klassifizierer:<\/strong> Er bestimmt das Datenschema.<a href=\"https:\/\/aws.amazon.com\/de\/glue\/\"><strong> AWS Glue<\/strong> stellt Klassifizierer<\/a> f\u00fcr die g\u00e4ngigsten Dateitypen wie CSV, Json usw. bereit.<\/li>\n\n\n\n<li><strong>Datenspeicher:<\/strong> Repository f\u00fcr die persistente Speicherung von Daten.<\/li>\n\n\n\n<li><strong>Data source:<\/strong> Dies ist der Eingabepunkt, der f\u00fcr den Transformationsprozess verwendet wird.<\/li>\n\n\n\n<li>Data target: Das ist das Ziel, in das die Daten nach der Umwandlung geschrieben werden.<\/li>\n\n\n\n<li>Job: Gesch\u00e4ftslogik, die f\u00fcr die <strong>ETL-Arbeit<\/strong> ben\u00f6tigt wird und aus den verschiedenen notwendigen Elementen besteht.<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\">AWS Glue lernen<\/a><\/div>\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-die-funktionen-von-aws-glue\">Die Funktionen von AWS Glue<\/h2>\n\n\n\n<p>AWS Glue erm\u00f6glicht dir eine umfassende Verwaltung deiner ETL-Prozesse durch verschiedene Funktionen, von denen die folgenden die wichtigsten und bedeutendsten sind:<\/p>\n\n\n\n<div>\n  <table style=\"width:100%;border-collapse: collapse;border: 1px solid #ddd\">\n    <thead>\n      <tr style=\"background-color: #ff6745;color: #efefef\">\n        <th style=\"border: 1px solid #ddd;padding: 8px\">&nbsp;<\/th>\n        <th style=\"border: 1px solid #ddd;padding: 8px\">SQL<\/th>\n        <th style=\"border: 1px solid #ddd;padding: 8px\">NoSQL<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Beschreibung<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">relational<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">nicht-relational<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Anwendung<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Abfrage zum Analysieren und Abrufen von Daten<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">f\u00fcr eine Vielzahl moderner Anwendungen wie WebApps geeignet<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Abfragesprache<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">SQL<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">mehrere Sprachen je nach Anwendung<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Typ<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Tabelle<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Dokument \/ Graph \/ Key-Value<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Schema<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">festgelegt und vordefiniert<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">dynamisch<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Data Management System (Beispiele)<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Oracle, PostGres, MySQL<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">MongoDB, Neo4J<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Eignet sich f\u00fcr<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">komplexe und intensive Abfragen<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Gro\u00dfe Datenbanken, Big Data<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Entwicklungsjahre<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">70er Jahre<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">2000er<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Open Source<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Open Source (PostGres, MySQL) und propriet\u00e4re Systeme (Oracle)<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Open Source<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Vorteile<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">optimierte Datenspeicherung und Stabilit\u00e4t<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">einfache und flexible Speicherung<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Nachteile<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">keine Flexibilit\u00e4t, erforderliche Expertise<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">manchmal zu flexibel<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n<\/div>\n\n\n\n<p>\n.tg {border-collapse:collapse;border-spacing:0;}<br \/>\n.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg .tg-yj5y{background-color:#efefef;border-color:inherit;text-align:center;vertical-align:top}<br \/>\n.tg .tg-dvid{background-color:#efefef;border-color:inherit;font-weight:bold;text-align:left;vertical-align:top}<br \/>\n.tg .tg-y698{background-color:#efefef;border-color:inherit;text-align:left;vertical-align:top}<br \/>\n<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-vor-und-nachteile-von-aws-glue\">Vor- und Nachteile von AWS Glue<\/h2>\n\n\n\n<p>Bevor du dich mit der Nutzung und dem Erlernen von <strong>AWS Glue<\/strong> besch\u00e4ftigst, ist es wichtig, die Vorteile, aber auch die Nachteile zu bedenken:<\/p>\n\n\n\n<div>\n  <table style=\"width:100%;border-collapse: collapse;border: 1px solid #ddd\">\n    <thead>\n      <tr style=\"background-color: #ff6745;color: #efefef\">\n        <th style=\"border: 1px solid #ddd;padding: 8px\">Vorteile<\/th>\n        <th style=\"border: 1px solid #ddd;padding: 8px\">Nachteile<\/th>\n      <\/tr>\n    <\/thead>\n    <tbody>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Gro\u00dfe Datenmengen verwalten<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Hohe Kosten f\u00fcr kleine Unternehmen oder kleine Projekte, trotz der Tatsache, dass der Dienst vollst\u00e4ndig verwaltet wird<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Geschwindigkeit bei der Verarbeitung von Daten<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Lernkurve sehr gro\u00df<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Integration mit anderen AWS-Diensten<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Begrenzte Anpassungen von Workflows<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Unterst\u00fctzt mehrere Programmiersprachen<\/td>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Erfordert Expertise im Data Engineering<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Vollst\u00e4ndig verwaltete Plattform<\/td>\n        <td rowspan=\"2\" style=\"border: 1px solid #ddd;padding: 8px\">&nbsp;<\/td>\n      <\/tr>\n      <tr>\n        <td style=\"border: 1px solid #ddd;padding: 8px\">Integrierter Metadatenkatalog<\/td>\n      <\/tr>\n    <\/tbody>\n  <\/table>\n<\/div>\n\n\n\n<p>\n.tg {border-collapse:collapse;border-spacing:0;}<br \/>\n.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg .tg-d78e{background-color:#9aff99;text-align:center;vertical-align:top}<br \/>\n.tg .tg-cmwg{background-color:#ffccc9;text-align:center;vertical-align:top}<br \/>\n.tg .tg-s47q{background-color:#9aff99;font-size:20px;font-weight:bold;text-align:center;vertical-align:top}<br \/>\n.tg .tg-rjvs{background-color:#ffccc9;font-size:20px;font-weight:bold;text-align:center;vertical-align:top}<br \/>\n<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-fazit\">Fazit<\/h2>\n\n\n\n<p>Wie du sicherlich verstanden hast, ist <strong>AWS Glue<\/strong> ein vollst\u00e4ndig von Amazon AWS verwalteter Dienst zur Verwaltung von <strong>ETL-Workflows.<\/strong> Seine gro\u00dfe Leistungsf\u00e4higkeit und Flexibilit\u00e4t erfordert jedoch eine Lernkurve und eine sehr hohe Investition, um ihn so einzurichten, dass er die erforderlichen Anforderungen erf\u00fcllt.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Mehr \u00fcber AWS Glue lernen<\/a><\/div>\n<\/div>\n\n\n\n<p>?Auch interessant:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><tbody><tr><td><a href=\"https:\/\/liora.io\/de\/amazon-s3\" target=\"_blank\" rel=\"noopener\">Amazon S3<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/aws-ec2-wie-man-das-amazon-tool-nutzt\" target=\"_blank\" rel=\"noopener\">Amazon EC2<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/amazon-web-services\" target=\"_blank\" rel=\"noopener\">Amazon Web Services<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/amazon-web-service-aws-microsoft-azure-oder-google-cloud-platform-gcp\" target=\"_blank\" rel=\"noopener\">AWS Google Cloud<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/amazon-omics-von-aws-alles-wichtige\" target=\"_blank\" rel=\"noopener\">Amazon Omics<\/a><\/td><\/tr><tr><td><a href=\"https:\/\/liora.io\/de\/amazon-quicksight-q-ein-business-intelligence-tool-das-mit-power-bi-konkurrieren-soll\" target=\"_blank\" rel=\"noopener\">Amazon Quicksight<\/a><\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Erinnerung an ETL-Prozesse\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"ETL (Extract, Transform, Load) ist ein dreistufiger Prozess zur Sicherung von Datenqualit\u00e4t und -verf\u00fcgbarkeit: Extraktion (Daten aus verschiedenen Quellen abrufen), Transformation (Daten bereinigen, normalisieren, nutzbar machen), Laden (transformierte Daten in Endumgebung wie Datenbank oder Data Warehouse \u00fcberf\u00fchren).\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wie ist AWS Glue aufgebaut?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"AWS Glue besteht aus mehreren Komponenten: Data Catalog (Metadatenspeicher), Datenbank (Sammlung von Tabellendefinitionen), Crawler (verbindet Datenquellen, extrahiert Daten, erstellt Tabellendefinitionen), Verbindung (enth\u00e4lt Informationen f\u00fcr Datenspeicher-Zugriff), Klassifizierer (bestimmt Datenschema f\u00fcr g\u00e4ngige Formate), Datenspeicher (persistente Datenspeicherung), Data source (Eingabepunkt), Data target (Ziel nach Transformation), Job (Gesch\u00e4ftslogik f\u00fcr ETL).\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Die Funktionen von AWS Glue\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Die wichtigsten Funktionen sind: umfassende Verwaltung von ETL-Prozessen, vollst\u00e4ndig verwalteter und skalierbarer Datenverarbeitungsdienst, serverlose ETL-Workflows ohne Infrastrukturverwaltung.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Vor- und Nachteile von AWS Glue\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Vorteile: Verwaltung gro\u00dfer Datenmengen, hohe Verarbeitungsgeschwindigkeit, Integration mit anderen AWS-Diensten, Unterst\u00fctzung mehrerer Programmiersprachen, vollst\u00e4ndig verwaltete Plattform, integrierter Metadatenkatalog. Nachteile: Hohe Kosten f\u00fcr kleine Unternehmen\/Projekte, steile Lernkurve, begrenzte Workflow-Anpassungen, erfordert Data-Engineering-Expertise.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Fazit\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"AWS Glue ist ein vollst\u00e4ndig verwalteter AWS-Dienst f\u00fcr ETL-Workflows mit hoher Leistungsf\u00e4higkeit und Flexibilit\u00e4t. Erfordert jedoch steile Lernkurve und hohe Investition f\u00fcr korrekte Einrichtung.\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>ETL ist ein Prozess, der darauf abzielt, die Qualit\u00e4t und Verf\u00fcgbarkeit der Daten zu gew\u00e4hrleisten. Er ist in drei Phasen unterteilt:<\/p>\n","protected":false},"author":82,"featured_media":179202,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-179201","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179201","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/82"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=179201"}],"version-history":[{"count":5,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179201\/revisions"}],"predecessor-version":[{"id":219448,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179201\/revisions\/219448"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/179202"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=179201"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=179201"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}