{"id":179212,"date":"2023-06-30T12:42:01","date_gmt":"2023-06-30T11:42:01","guid":{"rendered":"https:\/\/liora.io\/de\/?p=179212"},"modified":"2026-02-06T06:37:54","modified_gmt":"2026-02-06T05:37:54","slug":"amazon-emr-ein-von-aws-verwaltetes-tool-zur-verwaltung-von-clustern","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/amazon-emr-ein-von-aws-verwaltetes-tool-zur-verwaltung-von-clustern","title":{"rendered":"Amazon EMR: Ein von AWS verwaltetes Tool zur Verwaltung von Clustern"},"content":{"rendered":"<h3>Amazon EMR (Elastic MapReduce) ist ein Datenverarbeitungsdienst, der von Amazon Web Service (AWS) verwaltet wird. Er verwaltet gro\u00dfe Datenmengen im Petabyte-Bereich mithilfe beliebter Tools wie Apache Hadoop, Hive, Spark und HBase, um nur einige zu nennen.<\/h3>\n<strong>Amazon EMR<\/strong> wurde so konzipiert, dass es eine hohe Flexibilit\u00e4t und Skalierbarkeit bietet, die es den Nutzern erm\u00f6glicht, sehr schnelle Ergebnisse zu erzielen, indem sie leistungsstarke und hochkonfigurierbare Rechencluster verwenden.\n<h3>EMR wurde so konzipiert, dass es eine hohe Flexibilit\u00e4t und Skalierbarkeit bietet, die es den Nutzern erm\u00f6glicht, sehr schnelle Ergebnisse zu erzielen, indem sie leistungsstarke und hochkonfigurierbare Rechencluster verwenden.<\/h3>\nDie Funktionsweise von <strong>Amazon EMR<\/strong> beruht auf der Erstellung von <strong>Datenverarbeitungsclustern,<\/strong> die so konfiguriert werden, dass sie den spezifischen Anforderungen jeder Aufgabe entsprechen.\n\nDiese Cluster werden auf der Grundlage der ben\u00f6tigten Rechen- und Speicherressourcen erstellt.\n\nEin Cluster besteht aus Knoten, die verschiedene Arten von Knoten sein k\u00f6nnen:\n<ul>\n \t<li><strong>Ein Masterknoten (Master Node):<\/strong> Er verwaltet den Cluster und seine Ressourcen. Als prim\u00e4rer Knoten orchestriert er die Aufgaben der Datenverarbeitung. Au\u00dferdem speichert er die Metadaten des Clusters und bietet eine Befehlszeilenschnittstelle (CLI) und eine Webschnittstelle, um mit dem Cluster zu interagieren.<\/li>\n \t<li><strong>Kernknoten (core nodes):<\/strong> Sie werden vom Prim\u00e4rknoten verwaltet und koordinieren die Speicherung der Daten in einem Dateisystem wie <a href=\"https:\/\/liora.io\/de\/hdfs-hadoop-distributed-file-system-was-ist-das\">HDFS<\/a>. Dar\u00fcber hinaus f\u00fchren sie parallele Verarbeitungsaufgaben aus.<\/li>\n \t<li><strong>Aufgabenknoten (task nodes):<\/strong> Diese Knoten sind optional und werden verwendet, um die Kapazit\u00e4t von parallelen Verarbeitungsaufgaben auf Daten zu erh\u00f6hen, wie<a href=\"https:\/\/liora.io\/de\/mapreduce\"> MapReduce<\/a>&#8211; oder <a href=\"https:\/\/liora.io\/de\/spark-streaming-was-ist-das-wie-funktioniert-es\">Spark-Jobs.<\/a> Sie speichern jedoch keine Daten auf dem HDFS.<\/li>\n<\/ul>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"366\" height=\"225\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image3-2.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image3-2.png 366w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image3-2-300x184.png 300w\" sizes=\"(max-width: 366px) 100vw, 366px\"><figcaption><\/figcaption><\/figure>\nUm Rechen- und Speicherkapazit\u00e4t zur Verf\u00fcgung zu stellen, nutzt <a href=\"https:\/\/liora.io\/de\/aws-ec2-wie-man-das-amazon-tool-nutzt\">EMR EC2-Instanzen (Elastic Compute Cloud).<\/a> Diese Instanzen sind virtuelle Maschinen, die in hohem Ma\u00dfe konfigurierbar und an die jeweiligen Bed\u00fcrfnisse anpassbar sind.\n\nWenn der <strong>EMR-Cluster<\/strong> erstellt wird, werden die erforderlichen Tools automatisch auf jedem Knoten des Clusters installiert (haupts\u00e4chlich Tools wie <a href=\"https:\/\/liora.io\/de\/hadoop\">Hadoop<\/a>, Spark oder Hive). F\u00fcr die Planung und Ausf\u00fchrung von Verarbeitungsaufgaben werden <a href=\"\/\">Manager wie YARN (der bekannteste) oder Mesos verwendet.<\/a>\n\nDa die <strong>AWS-Dienste<\/strong> besonders gut miteinander integriert sind, k\u00f6nnen Datenquellen wie <a href=\"https:\/\/liora.io\/de\/amazon-s3\">Amazon S3<\/a>, RDS oder DynamoDB verwendet werden, um die Verarbeitung durch EMR zu erm\u00f6glichen. In der gleichen Integrationsrichtung wird Amazon Cloudwatch verwendet, um die Leistung und Verf\u00fcgbarkeit des Clusters zu verfolgen.\n<h3>Ist die Umsetzung kompliziert?<\/h3>\nDie Installation und Implementierung von Amazon EMR ist ein relativ einfacher Prozess, der in wenigen Schritten durchgef\u00fchrt werden kann. Die Voraussetzung ist nat\u00fcrlich ein AWS-Konto.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Amazon EMR lernen<\/a><\/div><\/div>\n\n\nWenn du dich in dein Konto eingeloggt hast, w\u00e4hle einfach den EMR-Service aus.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/05\/image4.png\" title=\"\" alt=\"\" loading=\"lazy\">\n\n<figcaption><\/figcaption><\/figure>\nW\u00e4hle den hervorgehobenen Button &#8222;Cluster erstellen&#8220;\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/05\/image5.png\" title=\"\" alt=\"\" loading=\"lazy\">\n\n<figcaption><\/figcaption><\/figure>\nFolge dann den Schritten zur Erstellung eines Clusters je nach deinen Bed\u00fcrfnissen. Hier ist eine Zusammenfassung der Arten von EC2-Instanzen :\n\n<style type=\"text\/css\">\n.tg {border-collapse:collapse;border-spacing:0;}<br \/>\n.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;<br \/>\n  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}<br \/>\n.tg .tg-62vj{background-color:#9b9b9b;color:#efefef;font-family:Tahoma, Geneva, sans-serif !important;font-size:16px;<br \/>\n  font-weight:bold;text-align:center;vertical-align:top}<br \/>\n.tg .tg-o36d{font-family:Tahoma, Geneva, sans-serif !important;text-align:center;vertical-align:top}<br \/>\n<\/style>\n<table style=\"undefined;table-layout: fixed; width: 600px\">\n<colgroup>\n<col style=\"width: 200px\">\n<col style=\"width: 200px\">\n<col style=\"width: 200px\">\n<\/colgroup>\n<thead>\n<tr>\n<th>Instanz-Klasse<\/th>\n<th>Instanz-Familie<\/th>\n<th>Empfohlene Nutzung<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Allgemeiner Zweck<\/td>\n<td>M4, M5<\/td>\n<td>Traitement par lot<\/td>\n<\/tr>\n<tr>\n<td>Compute Optimized<\/td>\n<td>C5,C4<\/td>\n<td>Maschinelles Lernen<\/td>\n<\/tr>\n<tr>\n<td>Speicheroptimiert<\/td>\n<td>X1,X4<\/td>\n<td>Analysen interaktiv<\/td>\n<\/tr>\n<tr>\n<td>Speicheroptimiert<\/td>\n<td>D2, I3<\/td>\n<td>HDFS volumineux<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/05\/image7.png\" title=\"\" alt=\"\" loading=\"lazy\">\n\n<figcaption><\/figcaption><\/figure>\nSobald du den Cluster erstellt hast, musst du nur noch Anwendungen zur Datenverarbeitung ausf\u00fchren und bereitstellen. Achte jedoch auf die Preisgestaltung.\n<h3>Die Preise<\/h3>\nDie mit der Nutzung von<strong> Amazon EMR<\/strong> verbundenen Kosten k\u00f6nnen je nach Region variieren. Au\u00dferdem berechnet AWS EMR sowohl f\u00fcr seine Instanz als auch f\u00fcr <strong>EC2-Instanzen.<\/strong> Die Abrechnung erfolgt im Sekundentakt mit einer Mindestpauschale von einer Minute. Hier findest du die Preisliste von Amazon f\u00fcr die Nutzung dieses Dienstes.\n\n?Auch interessant:\n<table dir=\"ltr\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<colgroup>\n<col width=\"426\"><\/colgroup>\n<tbody>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Amazon S3&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/amazon-s3\"><a href=\"https:\/\/liora.io\/de\/amazon-s3\" target=\"_blank\" rel=\"noopener\">Amazon S3<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Amazon EC2&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/aws-ec2-wie-man-das-amazon-tool-nutzt\"><a href=\"https:\/\/liora.io\/de\/aws-ec2-wie-man-das-amazon-tool-nutzt\" target=\"_blank\" rel=\"noopener\">Amazon EC2<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Amazon Web Services&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/amazon-web-services\"><a href=\"https:\/\/liora.io\/de\/amazon-web-services\" target=\"_blank\" rel=\"noopener\">Amazon Web Services<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;AWS Google Cloud&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/amazon-web-service-aws-microsoft-azure-oder-google-cloud-platform-gcp\"><a href=\"https:\/\/liora.io\/de\/amazon-web-service-aws-microsoft-azure-oder-google-cloud-platform-gcp\" target=\"_blank\" rel=\"noopener\">AWS Google Cloud<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Amazon Omics&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/amazon-omics-von-aws-alles-wichtige\"><a href=\"https:\/\/liora.io\/de\/amazon-omics-von-aws-alles-wichtige\" target=\"_blank\" rel=\"noopener\">Amazon Omics<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Amazon Quicksight&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/amazon-quicksight-q-ein-business-intelligence-tool-das-mit-power-bi-konkurrieren-soll\"><a href=\"https:\/\/liora.io\/de\/amazon-quicksight-q-ein-business-intelligence-tool-das-mit-power-bi-konkurrieren-soll\" target=\"_blank\" rel=\"noopener\">Amazon Quicksight<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h3>Case Studies<\/h3>\nSehen wir uns gemeinsam zwei Fallstudien an, in denen <strong>AWS EMR<\/strong> die Antwort auf Probleme bei der Datenverarbeitung bietet.\n\n<img decoding=\"async\" width=\"465\" height=\"188\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image6.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image6.png 465w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image6-300x121.png 300w\" sizes=\"(max-width: 465px) 100vw, 465px\">\n\nDie Online-Plattform f\u00fcr Restaurantbewertungen (u. a.) <a href=\"https:\/\/www.yelp.fr\/paris\">Yelp<\/a>, wandte sich sich f\u00fcr die Verarbeitung und Analyse von Bewertungen in Echtzeit und in gro\u00dfem Umfang an EMR. Durch seine Nutzung kann Yelp dann detaillierte Analysen \u00fcber Entwicklungen erhalten. Da die Anforderungen des Unternehmens stark schwanken, kann Yelp nun seine Verarbeitungskapazit\u00e4t anpassen, um diesen Anforderungen gerecht zu werden.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"800\" height=\"450\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2-1024x576.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2-1024x576.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2-300x169.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2-768x432.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2-1536x864.png 1536w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/06\/image2.png 1999w\" sizes=\"(max-width: 800px) 100vw, 800px\">\n\n<figcaption><\/figcaption><\/figure>\nAls Immobilienunternehmen (mit Sitz in den USA) haben sie sich f\u00fcr den Einsatz von <strong>Amazon EMR<\/strong> entschieden, um ihre Algorithmen f\u00fcr Immobilienprognosen in sehr gro\u00dfem Ma\u00dfstab einzusetzen. So k\u00f6nnen sie Immobiliendaten schnell und effizient verarbeiten, um ihren Kunden genauere Preisentwicklungen zu liefern und die Ver\u00e4nderungen auf diesem sehr volatilen Markt in Echtzeit zu \u00fcberwachen.\n<h3>Fazit<\/h3>\nAmazon EMR ist eine leistungsstarke und flexible <a href=\"https:\/\/liora.io\/de\/die-hybrid-cloud-was-ist-das-wie-funktioniert-sie\">Cloud-L\u00f6sung f\u00fcr die Verarbeitung gro\u00dfer Datenmengen,<\/a> wie du in diesem Artikel erfahren hast. Dank seiner Benutzerfreundlichkeit und der F\u00e4higkeit, sich in andere<a href=\"https:\/\/liora.io\/de\/aws-glue-was-ist-das-wozu-dient-es\"> AWS-Dienste zu integrieren, ist es eine erstklassige L\u00f6sung f\u00fcr Unternehmen,<\/a> die eine hohe Leistung bei der Analyse ihrer Daten ben\u00f6tigen, um gute Entscheidungen zu treffen und sich so an die sich \u00e4ndernden Marktbed\u00fcrfnisse anzupassen.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/aws-zertifizierung-was-ist-das-und-wie-erhalte-ich-sie\">Amazon AWS Weiterbildung<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Amazon EMR (Elastic MapReduce) ist ein Datenverarbeitungsdienst, der von Amazon Web Service (AWS) verwaltet wird. Er verwaltet gro\u00dfe Datenmengen im Petabyte-Bereich mithilfe beliebter Tools wie Apache Hadoop, Hive, Spark und HBase, um nur einige zu nennen. Amazon EMR wurde so konzipiert, dass es eine hohe Flexibilit\u00e4t und Skalierbarkeit bietet, die es den Nutzern erm\u00f6glicht, sehr [&hellip;]<\/p>\n","protected":false},"author":78,"featured_media":179214,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-179212","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179212","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/78"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=179212"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179212\/revisions"}],"predecessor-version":[{"id":217424,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/179212\/revisions\/217424"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/179214"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=179212"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=179212"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}