{"id":165230,"date":"2022-12-14T22:57:06","date_gmt":"2022-12-14T21:57:06","guid":{"rendered":"https:\/\/liora.io\/de\/?p=165230"},"modified":"2026-02-06T07:07:04","modified_gmt":"2026-02-06T06:07:04","slug":"was-ist-azure-data-factory","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/was-ist-azure-data-factory","title":{"rendered":"Azure Data Factory: Was ist das und wozu dient es?"},"content":{"rendered":"<p><strong>Im Zeitalter von Big Data sind die Rohdaten oft unorganisiert und in unterschiedlichen Systemen gespeichert. Wenn diese Daten isoliert sind, k\u00f6nnen Unternehmen und Datenteams sie nicht optimal nutzen und daraus Entscheidungen ableiten. Die Microsoft Azure Data Factory soll diese Probleme l\u00f6sen, indem sie Rohdaten aus verschiedenen Quellen zu verwertbaren Daten f\u00fcr Unternehmen macht.<\/strong><\/p>\n<h3>Was ist die Azure Data Factory?<\/h3>\n<a href=\"https:\/\/azure.microsoft.com\/fr-fr\/services\/data-factory\/\">Azure Data Factory<\/a> ist ein Dienst, der von <a href=\"https:\/\/azure.microsoft.com\/fr-fr\/services\/data-factory\/\">Microsoft<\/a> entwickelt wurde, um es Entwicklern zu erm\u00f6glichen, verschiedene Datenquellen zu integrieren. Es handelt sich um eine <a href=\"https:\/\/docs.microsoft.com\/fr-fr\/sql\/integration-services\/sql-server-integration-services?view=sql-server-ver15\">SSIS-\u00e4hnliche<\/a> Plattform, mit der du die Daten, die du physisch und in der Cloud hast, verwalten kannst.\n\nSSIS-Definition: SSIS &#8211; SQL server integration services &#8211; ist eine Komponente der Software Microsoft SQL Database, mit der du Datenmigrationen durchf\u00fchren kannst.\n\nDieser Dienst erm\u00f6glicht den Zugriff auf Daten vor Ort wie in einer SQL-Datenbank, aber auch auf Daten in der Cloud wie in der Azure SQL Database.\n\nAzure Data Factory ist eine perfekte L\u00f6sung, wenn es darum geht, hybride Pipelines f\u00fcr <strong>Extraktion-Transformation-Laden<\/strong> (d. h. <strong>den ETL-Prozess<\/strong>) oder <strong>Extraktion-Laden-Transformation (ELT)<\/strong> und Datenintegration aufzubauen.\n\nETL ist eine Art Datenintegrationsprozess, der aus drei verschiedenen, aber miteinander verbundenen Schritten besteht (Extraktion, Transformation und Laden). Es wird verwendet, um Daten aus mehreren Quellen immer und immer wieder zusammenzufassen, um ein Data Warehouse, einen Data Hub oder einen Data Lake aufzubauen.\n\nData Factory ist zu einem unverzichtbaren Werkzeug beim <a href=\"https:\/\/liora.io\/de\/cloud-computing\">Cloud-Computing<\/a> geworden. In fast allen Projekten musst du Aktivit\u00e4ten durchf\u00fchren, bei denen du Daten \u00fcber verschiedene Netzwerke (Vor-Ort-Netzwerk und Cloud) und Dienste (von und zu verschiedenen Azure-Speichern) verschiebst.\n\nData Factory ist ein besonders notwendiges Werkzeug f\u00fcr Organisationen, die ihre ersten Schritte in der Cloud machen und daher versuchen, die Daten vor Ort mit der Cloud zu verbinden. Um dies zu erreichen, verf\u00fcgt Azure Data Factory \u00fcber eine <strong>Integration Runtime Engine<\/strong>, einen Gateway-Service, der vor Ort installiert werden kann und eine leistungsstarke und sichere \u00dcbertragung von Daten von und zur Cloud gew\u00e4hrleistet.\n<h3>Wie funktioniert die Azure Data Factory?<\/h3>\n<h4><i>Anmelden und Daten sammeln<\/i><\/h4>\nDer erste Schritt besteht darin, Daten aus verschiedenen Quellen zu <strong>verbinden und zu sammeln<\/strong>, egal ob sie lokal, in der Cloud, strukturiert oder unstrukturiert sind. Die Azure Data Factory erm\u00f6glicht es, alle verschiedenen Datenquellen und Datenverarbeitungsdienste miteinander zu verbinden. Anschlie\u00dfend geht es darum, die Daten an einen zentralen Ort zu verschieben. Im klassischen Fall m\u00fcssen Unternehmen die gesamte Dateninfrastruktur aufbauen, um die Daten zu verschieben. Mit Data Factory ist dieser Schritt sehr einfach und schnell.\n<h4><i>Transformation von Daten<\/i><\/h4>\nSobald sich die Daten in einem zentralen Datenlager in der Cloud befinden, erm\u00f6glicht die Azure Data Factory Datenteams, die gesammelten Daten mithilfe der Azure Data Factory-Mapping-Datenstr\u00f6me zu verarbeiten und zu transformieren. Mithilfe der Datenstr\u00f6me k\u00f6nnen Dateningenieure Datenumwandlungsgrafiken erstellen und pflegen, die auf Spark laufen, ohne Spark-Cluster oder die Spark-Programmierung verstehen zu m\u00fcssen. Azure Data Factory erm\u00f6glicht es dir jedoch auch, all diese Transformationen von Hand zu codieren, wenn du m\u00f6chtest, und du kannst deine Transformationen auf Rechendiensten wie HDInsight Hadoop, Spark, Data Lake Analytics und Machine Learning ausf\u00fchren.\n<h4><i>Ver\u00f6ffentlichung von Daten und Aufsicht<\/i><\/h4>\nAzure Data Factory erm\u00f6glicht es Dir, Deine <strong>Daten zu ver\u00f6ffentlichen<\/strong>. Data Factory bietet dir die M\u00f6glichkeit, die CI\/CD &#8211; continuous integration\/continuous delivery &#8211; der Pipelines vollst\u00e4ndig zu unterst\u00fctzen, z. B. mit Azure Devops. Auf diese Weise kannst du deine ETL-Prozesse erstellen und weiterentwickeln. Sobald alle deine Rohdaten umgewandelt sind, kannst du sie in andere Azure-Analysetools hochladen, damit deine Mitarbeiter sie visualisieren, Entscheidungen treffen, <strong>den Datenfluss<\/strong> mit einer reichhaltigen grafischen Benutzeroberfl\u00e4che <strong>\u00fcberwachen und Entscheidungen treffen k\u00f6nnen<\/strong>. Sobald du also deine Datenpipelines erstellt hast, kannst du den Gesch\u00e4ftswert deiner Daten nutzen. In dieser Phase kannst du die Pipelines \u00fcberwachen und auf Leistungsindizes oder deine Erfolgsraten zugreifen.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-engineer\">Entdecke unsere Azure-Trainings<\/a><\/div><\/div>\n\n<h3>Azure Data Factory VS herk\u00f6mmliche ETL-Tools<\/h3>\nAzure Data Factory ist eine der besten Optionen, wenn es um den Aufbau von ETL- (oder ELT-) Pipelines in der Cloud und in hybriden Systemen geht. Es gibt einige Merkmale, die Azure Data Factory von anderen Tools unterscheiden.\n<ul>\n \t<li>Die F\u00e4higkeit, SSIS-Pakete auszuf\u00fchren.<\/li>\n \t<li>Automatische Anpassung an die gegebene Auslastung. Azure Data Factory geht sogar noch einen Schritt weiter, indem es seinen Kunden versichert, dass die Preise f\u00fcr <strong>Data Factory<\/strong> nutzungsbasiert sind. Die Anzahl der Aktivit\u00e4ten (Datenverarbeitungsschritte) pro Monat und die Nutzung der Integrationslaufzeit wird pro Stunde abgerechnet, abh\u00e4ngig von der Maschine und der Anzahl der genutzten Knoten.<\/li>\n \t<li><strong>Nahtlose<\/strong> Verbindung zwischen Systemen vor Ort und der Azure-Cloud \u00fcber ein Gateway.<\/li>\n \t<li>Verwaltung <strong>gro\u00dfer Datenmengen<\/strong>, die im Zeitalter von Big Data von entscheidender Bedeutung sind<\/li>\n \t<li>M\u00f6glichkeit, es mit anderen Rechendiensten (Azure Batch, HDInsights) zu verbinden und mit ihnen zusammenzuarbeiten, um wirklich gro\u00dfe Datenberechnungen w\u00e4hrend des ETL durchzuf\u00fchren.<\/li>\n<\/ul>\nSchlie\u00dflich ist einer der sehr gro\u00dfen Vorteile die schnelle und einfache Integration mit anderen Azure Compute &amp; Storage-Ressourcen. Es gibt 2 Arten von verbundenen Diensten &#8211; d.h. Verbindungsketten &#8211; die du definieren kannst:\n<ul>\n \t<li>Ein Speicherdienst, um einen Datenspeicher &#8211; Datamart &#8211; darzustellen, der : Azure SQL Database, Azure SQL Data Warehouse, eine On-Premise-Datenbank, ein Data Lake, ein Dateisystem, eine NoSQL-DB usw.<\/li>\n \t<li>Eine IT-Abteilung zur Umwandlung und <strong>Anreicherung von Daten<\/strong>: z. B. Azure HDInsight, Azure Machine Learning, gespeicherte Prozedur auf jeder SQL, U-SQL Data Lake Analytics Aktivit\u00e4t, Azure Databricks und\/oder Azure Batch (unter Verwendung einer benutzerdefinierten Aktivit\u00e4t).<\/li>\n<\/ul>\nDaten erfordern Software und Dienstleistungen, die Prozesse rationalisieren k\u00f6nnen, um die in den Systemen gespeicherten Rohdaten in Daten zu bereinigen, die von den Datenteams genutzt werden k\u00f6nnen. Die Beherrschung von Software wie Azure Data Factory ist heute f\u00fcr Data Engineer und Data Scientists unerl\u00e4sslich.\n\nWenn Du mehr \u00fcber diese unumg\u00e4nglichen Datenberufe erfahren m\u00f6chtest, dann informiere Dich \u00fcber die <strong>Ausbildung zum Data Engineer<\/strong>, die von Liora angeboten wird und von der <strong>Universit\u00e4t Paris 1 Panth\u00e9on-Sorbonne<\/strong>&nbsp;zertifiziert ist.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-engineer\">Entdecke die Ausbildung zum Data Engineer<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Im Zeitalter von Big Data sind die Rohdaten oft unorganisiert und in unterschiedlichen Systemen gespeichert. Wenn diese Daten isoliert sind, k\u00f6nnen Unternehmen und Datenteams sie nicht optimal nutzen und daraus Entscheidungen ableiten. Die Microsoft Azure Data Factory soll diese Probleme l\u00f6sen, indem sie Rohdaten aus verschiedenen Quellen zu verwertbaren Daten f\u00fcr Unternehmen macht. Was ist [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":165232,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-165230","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165230","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=165230"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165230\/revisions"}],"predecessor-version":[{"id":217753,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165230\/revisions\/217753"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/165232"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=165230"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=165230"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}