{"id":182183,"date":"2023-07-31T13:56:54","date_gmt":"2023-07-31T12:56:54","guid":{"rendered":"https:\/\/liora.io\/de\/?p=182183"},"modified":"2026-02-06T06:26:28","modified_gmt":"2026-02-06T05:26:28","slug":"apache-hadoop-hive-sql-fuer-die-entscheidungsfindung","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/apache-hadoop-hive-sql-fuer-die-entscheidungsfindung","title":{"rendered":"Apache Hadoop Hive: SQL f\u00fcr die Entscheidungsfindung"},"content":{"rendered":"<style>\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style>\n<h3>Das Open-Source-Framework der wichtigsten Big-Data-Plattform, Hadoop, erweist sich als ideal f\u00fcr die Speicherung und Verarbeitung gro\u00dfer Datenmengen. F\u00fcr das Extrahieren von Daten erweist sich diese Plattform jedoch oft als komplex, zeitaufwendig und teuer. Aus diesem Grund hat die Apache Foundation eine neue Alternative entwickelt. Dabei handelt es sich um Apache Hive.<\/h3>\n<p>?Zur Erinnerung: In der Computerprogrammierung bezeichnet ein <a href=\"https:\/\/liora.io\/de\/scaled-agile-framework-safe-der-vollstaendige-guide\">Framework<\/a> eine koh\u00e4rente Sammlung von strukturellen Softwarekomponenten, die dazu dient, das Fundament sowie die Architektur einer Software zu schaffen.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\"><br \/>\nLerne Apache Hive<br \/>\n<\/a><\/p>\n<h3>Apache Hive &#8211; was ist das?<\/h3>\n<p>Apache Hive ist ein Open-Source-Datawarehouse f\u00fcr <a href=\"https:\/\/liora.io\/de\/hadoop-vs-spark-training-wie-lerne-ich-den-umgang-mit-big-data-tools\">Hadoop.<\/a> Ein Data Warehouse funktioniert wie ein zentraler Speicher, in dem die Informationen aus einer oder mehreren Datenquellen stammen. Es sammelt also Daten aus verschiedenen und heterogenen Quellen mit dem Hauptziel, die Analyse und Abfrage mit einer Sprache, die syntaktisch <a href=\"https:\/\/liora.io\/de\/sql-left-join-was-ist-das-wie-funktioniert-es\">SQL<\/a> \u00e4hnelt, zu unterst\u00fctzen und die Entscheidungsfindung zu erleichtern.<\/p>\n<p>? Auch interessant:<\/p>\n<table dir=\"ltr\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<colgroup>\n<col width=\"426\"><\/colgroup>\n<tbody>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Spark&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-spark\"><a href=\"https:\/\/liora.io\/de\/apache-spark\" target=\"_blank\" rel=\"noopener\">Apache Spark<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Kafka&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-kafka\"><a href=\"https:\/\/liora.io\/de\/apache-kafka\" target=\"_blank\" rel=\"noopener\">Apache Kafka<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Cassandra&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-cassandra-die-beliebteste-nosql-bdd\"><a href=\"https:\/\/liora.io\/de\/apache-cassandra-die-beliebteste-nosql-bdd\" target=\"_blank\" rel=\"noopener\">Apache Cassandra<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Schulung&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-schulung-wie-lerne-ich-hadoop-spark-und-cassandra\"><a href=\"https:\/\/liora.io\/de\/apache-schulung-wie-lerne-ich-hadoop-spark-und-cassandra\" target=\"_blank\" rel=\"noopener\">Apache Schulung<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Airflow&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-airflow-was-ist-das-und-wie-kann-man-es-nutzen\"><a href=\"https:\/\/liora.io\/de\/apache-airflow-was-ist-das-und-wie-kann-man-es-nutzen\" target=\"_blank\" rel=\"noopener\">Apache Airflow<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Flume&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-flume-was-ist-das-wozu-dient-es\"><a href=\"https:\/\/liora.io\/de\/apache-flume-was-ist-das-wozu-dient-es\" target=\"_blank\" rel=\"noopener\">Apache Flume<\/a><\/td>\n<\/tr>\n<tr>\n<td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Apache Storm&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/apache-storm-was-ist-das-wozu-benutzt-man-es\"><a href=\"https:\/\/liora.io\/de\/apache-storm-was-ist-das-wozu-benutzt-man-es\" target=\"_blank\" rel=\"noopener\">Apache Storm<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<style>\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"800\" height=\"439\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-1024x562.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-1024x562.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-300x165.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-768x422.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-1536x843.png 1536w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/07\/schema_hadoop-116-1-2048x1124.png 2048w\" sizes=\"(max-width: 800px) 100vw, 800px\"><figcaption><\/figcaption><\/figure>\n<h3>Wie funktioniert Apache Hive?<\/h3>\n<p>Wie arbeitet <strong>Apache Hive?<\/strong> Dies sind drei Laufzeitmaschinen, die auf Hadoop gestartet werden k\u00f6nnen. Anschlie\u00dfend organisiert Apache Hive die Daten in einem Array f\u00fcr die<a href=\"https:\/\/liora.io\/de\/hdfs-hadoop-distributed-file-system-was-ist-das\"> HDFS-Datei (Hadoop Distributed Filed System)<\/a>, um die Tasks auf einem Cluster auszuf\u00fchren, um eine Antwort zu produzieren.<\/p>\n<p>Die Apache Hive-Tabellen \u00e4hneln denen einer relationalen Datenbank, und die Dateneinheiten werden von der gr\u00f6\u00dften bis zur granularsten Einheit organisiert. Datenbanken bestehen aus Arrays, die aus Partitionen bestehen, die wiederum in &#8222;Buckets&#8220; zerlegt werden k\u00f6nnen.<\/p>\n<p>Der Zugriff auf die Daten erfolgt \u00fcber <a href=\"https:\/\/learn.microsoft.com\/en-us\/azure\/hdinsight\/hadoop\/hdinsight-use-hive\">HiveQL<\/a>. Innerhalb jeder Datenbank sind die Daten nummeriert und jede Tabelle entspricht einem HDFS-Verzeichnis.<\/p>\n<p>Innerhalb der Apache Hive-Architektur gibt es mehrere Schnittstellen, wie z. B. Webinterface, CLI und Schnittstellen f\u00fcr externe Clients. Der <strong>&#8222;Apache Hive Thrift&#8220;-Server<\/strong> erm\u00f6glicht es entfernten Clients, Befehle und Anfragen an Apache Hadoop Hive zu senden, indem sie verschiedene Programmiersprachen verwenden. Das zentrale Verzeichnis von Apache Hive ist ein &#8222;Metastore&#8220;, der alle Informationen enth\u00e4lt.<\/p>\n<p>Der Motor,<strong> der den Betrieb von Hive erm\u00f6glicht,<\/strong> wird als &#8222;Treiber&#8220; bezeichnet. Er umfasst einen Compiler und einen Optimierer, um den besten Ausf\u00fchrungsplan zu bestimmen, sowie einen Executor.<\/p>\n<p>Schlie\u00dflich wird die Sicherheit durch Hadoop gew\u00e4hrleistet. Sie basiert daher auf Kerberos f\u00fcr die gegenseitige Authentifizierung zwischen Client und Server. Die Berechtigungen f\u00fcr neu erstellte Dateien in Apache Hive werden von <strong>HDFS<\/strong> diktiert, das die Autorisierung nach Benutzer, Gruppe oder anderen Kriterien erm\u00f6glicht.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/weiterbildung-data-engineer\"><br \/>\nData Engineer Weiterbildung<br \/>\n<\/a><\/p>\n<h3>Was sind die Vorteile der Verwendung von Apache Hive?<\/h3>\n<p><strong>Apache Hadoop Hive<\/strong> ist eine ideale L\u00f6sung f\u00fcr Datenabfragen und -analysen. Sie liefert qualitative Informationen (&#8222;Insights&#8220;), die einen Wettbewerbsvorteil bieten und die Reaktion auf die Marktnachfrage erleichtern.<\/p>\n<p>Zu den<strong> Hauptvorteilen von Apache Hadoop Hive<\/strong> geh\u00f6rt die einfache Handhabung der <a href=\"https:\/\/liora.io\/de\/no-sql-nicht-relationale-datenbanken\">SQL-freundlichen Sprache.<\/a> Au\u00dferdem beschleunigt die Software das erstmalige Einf\u00fcgen von Daten, da die Daten nicht von einer Diskette im internen Format der Datenbank gelesen oder nummeriert werden m\u00fcssen.<\/p>\n<p>Da die Daten im HDFS gespeichert werden, ist es m\u00f6glich, gro\u00dfe Datasets mit bis zu Hunderten von Petabytes an Daten auf Apache Hive zu speichern. Dadurch ist diese L\u00f6sung viel skalierbarer als eine traditionelle Datenbank. Da es sich bei Apache Hive um einen <strong>Cloud-Dienst<\/strong> handelt, k\u00f6nnen die Benutzer schnell virtuelle Server starten, wenn sich die Workloads (Aufgaben) \u00e4ndern.<\/p>\n<p>Auch die Sicherheit kommt nicht zu kurz, da kritische Workloads repliziert werden k\u00f6nnen, um sie im Falle eines Problems wiederherstellen zu k\u00f6nnen. Die Arbeitsleistung ist mit bis zu 100.000 Anfragen pro Stunde un\u00fcbertroffen.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\"><br \/>\nEntdecke unsere Weiterbildungen<br \/>\n<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Das Open-Source-Framework der wichtigsten Big-Data-Plattform, Hadoop, erweist sich als ideal f\u00fcr die Speicherung und Verarbeitung gro\u00dfer Datenmengen. F\u00fcr das Extrahieren von Daten erweist sich diese Plattform jedoch oft als komplex, zeitaufwendig und teuer. Aus diesem Grund hat die Apache Foundation eine neue Alternative entwickelt. Dabei handelt es sich um Apache Hive. ?Zur Erinnerung: In der [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":182185,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-182183","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182183","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=182183"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182183\/revisions"}],"predecessor-version":[{"id":217292,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/182183\/revisions\/217292"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/182185"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=182183"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=182183"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}