{"id":172692,"date":"2023-03-20T09:51:08","date_gmt":"2023-03-20T08:51:08","guid":{"rendered":"https:\/\/liora.io\/de\/?p=172692"},"modified":"2026-02-06T06:58:28","modified_gmt":"2026-02-06T05:58:28","slug":"image-processing-grundlagen-und-praktische-anwendung","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/image-processing-grundlagen-und-praktische-anwendung","title":{"rendered":"Image Processing: Grundlagen und praktische Anwendung"},"content":{"rendered":"<p><strong>Bilder enthalten viele wichtige Informationen. W\u00e4hrend sie f\u00fcr unsere ge\u00fcbten Augen leicht zu erkennen sind, stellen sie eine echte Herausforderung f\u00fcr die Datenanalyse dar. Die Gesamtheit dieser Techniken ist unter dem Namen &#8222;Image Processing&#8220; oder Bildverarbeitung bekannt. In diesem Artikel erf\u00e4hrst du mehr \u00fcber die klassischen Algorithmen, Techniken und Werkzeuge zur Verarbeitung von Daten in Form von Bildern.<\/strong><\/p>\n<style><br \/>\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style>\n<h3>Was ist Image Processing ?<\/h3>\nWie der Name schon sagt, geht es bei der <strong>Bildverarbeitung um die Bearbeitung von Bildern,<\/strong> was viele verschiedene Techniken beinhalten kann. Das Endergebnis kann ein anderes Bild, eine Variation oder einfach ein Parameter dieses Bildes sein. Dieses Ergebnis kann dann f\u00fcr eine weitere Analyse oder Entscheidungsfindung verwendet werden.\n\nDies ist der zentrale Teil der Computervision die in vielen Beispielen aus der realen Welt wie <strong>Robotik, selbstfahrenden Autos und der Erkennung von Objekten eine entscheidende Rolle spielt<\/strong>. Die Bildverarbeitung erm\u00f6glicht es uns, Tausende von Bildern auf einmal umzuwandeln und zu manipulieren und daraus n\u00fctzliche Informationen zu extrahieren.\n<h3>Was ist ein Bild ?<\/h3>\nEin<strong> Bild kann als eine 2D-Funktion F(x,y)<\/strong> dargestellt werden, wobei x und y Raumkoordinaten sind. Es handelt sich also um eine Tabelle von Pixeln, die in Spalten und Reihen angeordnet sind. Der Wert von F an einem Punkt x,y ist als die Intensit\u00e4t eines Bildes an diesem Punkt bekannt. Wenn x, y und der Wert der Amplitude endlich sind, spricht man von einem digitalen Bild.\n\nEin<strong> Bild kann auch in 3D dargestellt werden, dessen Koordinaten x, y und z<\/strong> sind. Die Pixel sind dann in Form einer Matrix angeordnet. Das nennt man ein RGB-Bild (oder RGB auf Englisch). Wenn das Bild in Graustufen vorliegt, gibt es nur einen Kanal: z = 1.\n\n<style><br \/>\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x-1024x550.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x-1024x550.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x-300x161.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x-768x412.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x-1536x824.png 1536w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Repre\u0301sentation-Fond-Blanc@2x.png 1742w\" sizes=\"(max-width: 800px) 100vw, 800px\" width=\"800\" height=\"430\"><figcaption><\/figcaption><\/figure>\n<h3>Klassische Techniken der Bildbearbeitung<\/h3>\nHistorisch gesehen wurden Bilder mit mathematischen Analysemethoden bearbeitet, von denen wir im Folgenden einige vorstellen wollen:\n<ul>\n \t<li><strong>Gau\u00dfsche Unsch\u00e4rfe<\/strong> oder Gau\u00dfsche Gl\u00e4ttung ist das Ergebnis der Anwendung einer Gau\u00dfschen Funktion auf ein Bild, d. h. auf eine Matrix wie oben definiert. Sie wird verwendet, um das Bildrauschen zu reduzieren und Details abzuschw\u00e4chen. Der visuelle Effekt dieser Unsch\u00e4rfetechnik ist \u00e4hnlich wie das Betrachten eines Bildes durch eine lichtdurchl\u00e4ssige Leinwand. Sie wird manchmal als Datenerh\u00f6hungstechnik f\u00fcr Deep Learning verwendet, auf das wir weiter unten noch genauer eingehen werden.<\/li>\n \t<li><strong>Die Fourier-Transformation<\/strong> zerlegt ein Bild in seine Sinus- und Kosinuskomponenten. Sie hat zahlreiche Anwendungen wie die Rekonstruktion von Bildern, die Komprimierung von Bildern oder die Filterung von Bildern. Da wir von Bildern sprechen, wollen wir die diskrete Fourier-Transformation in Betracht ziehen.<\/li>\n<\/ul>\nBetrachten wir eine Sinuskurve, sie setzt sich aus drei Komponenten zusammen:\n<ul>\n \t<li>Die Amplitude &#8211; verbunden mit dem Kontrast.<\/li>\n \t<li>Die Ortsfrequenz &#8211; verbunden mit der Helligkeit<\/li>\n \t<li>Die Phase &#8211; verbunden mit der Farbinformation.<\/li>\n<\/ul>\nDie Kantenerkennung ist eine Bildverarbeitungstechnik, mit der man die Grenzen von Objekten in Bildern finden kann. Sie funktioniert, indem sie Diskontinuit\u00e4ten in der Helligkeit erkennt. Genauer gesagt werden Kanten als lokale <strong>Maxima des Bildgradienten definiert,<\/strong> d. h. Bereiche, in denen es eine gro\u00dfe Wertevariation zwischen zwei Pixelbereichen gibt. Der g\u00e4ngigste Algorithmus zur Erkennung von R\u00e4ndern ist der Sobel-Algorithmus.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Image Processing lernen<\/a><\/div><\/div>\n\n<h3>Image Processing mit neuronalen Netzen<\/h3>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Detection-des-contours@2x-1024x527.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Detection-des-contours@2x-1024x527.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Detection-des-contours@2x-300x154.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Detection-des-contours@2x-768x395.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Detection-des-contours@2x.png 1464w\" sizes=\"(max-width: 800px) 100vw, 800px\" width=\"800\" height=\"412\">\n\n<figcaption><\/figcaption><\/figure>\nMit dem Aufkommen von<a href=\"https:\/\/liora.io\/de\/neuronale-netze-einfach-erklaert\"> neuronalen Netzen<\/a> und erh\u00f6hter Rechenleistung wurde die Bildverarbeitung revolutioniert. Insbesondere Faltungsnetze, die auf den oben genannten Techniken basieren, zeichnen sich bei der Erkennung und dem Erkennen von Objekten oder Personen aus. Wie funktionieren sie?\n\nEin neuronales Faltungsnetz, kurz CNN, besteht aus drei Hauptschichten:\n\nDie<strong> Faltungsschicht (CONV): Sie ist f\u00fcr die Ausf\u00fchrung der Faltungsoperation<\/strong> verantwortlich. Das Element, das an der Ausf\u00fchrung der Faltungsoperation beteiligt ist, wird als Kern\/Filter (Matrix) bezeichnet. Der Kern f\u00fchrt horizontale und vertikale Verschiebungen durch, bis das gesamte Bild durchlaufen wird. Er funktioniert \u00e4hnlich wie die Technik zur Erkennung von Konturen.\n<strong>Pooling-Schicht (POOL):<\/strong> Diese Schicht ist f\u00fcr die Reduzierung der <strong>Dimensionalit\u00e4t<\/strong> verantwortlich. Sie verringert die Rechenleistung, die f\u00fcr die Verarbeitung der Daten erforderlich ist. Es gibt zwei Arten von Pooling: Maximales Pooling und mittleres Pooling.\n\nMaximales Pooling gibt den maximalen Wert des Bereichs zur\u00fcck, der vom Kern auf dem Bild abgedeckt wird. Das Durchschnitts-Pooling gibt den Mittelwert aller Werte des vom Kern abgedeckten Bereichs des Bildes zur\u00fcck.\n<strong>Fully Connected Layer (FC): Der Fully Connected Layer (FC)<\/strong> ist am Ende der CNN-Architekturen vorhanden. Sie \u00e4hnelt einer herk\u00f6mmlichen Schicht in neuronalen Netzen und erm\u00f6glicht es, nach Anwendung einer Aktivierungsfunktion die vom Netz erwartete Ausgabe, z. B. eine Klassifizierung, zur\u00fcckzugeben.\n\nDurch das Hinzuf\u00fcgen von<strong> nichtlinearen Funktionen (&#8222;RELU&#8220;)<\/strong> innerhalb der Netze oder durch spezielle Architekturen k\u00f6nnen komplexere Probleme gel\u00f6st werden. Es gibt zahlreiche Beispiele: DenseNet, <a href=\"https:\/\/liora.io\/de\/u-net-weiterbildungen-data-cn\">U-Net<\/a>, VGG&#8230;\n<h3>Generative Adversarial Networks<\/h3>\nDa die gelabelten Daten manchmal nicht ausreichen, um komplexe Netzwerke zu trainieren, werden heute besonders generative Modelle, sogenannte<a href=\"https:\/\/liora.io\/de\/was-ist-ein-conditional-generative-adversarial-network-cgan\"> GANs f\u00fcr Generative Adversarial Networks,<\/a> verwendet.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Second-Sche\u0301ma-Fond-Blanc@2x-957x1024.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Second-Sche\u0301ma-Fond-Blanc@2x-957x1024.png 957w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Second-Sche\u0301ma-Fond-Blanc@2x-280x300.png 280w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Second-Sche\u0301ma-Fond-Blanc@2x-768x822.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/03\/Image-Processing-Second-Sche\u0301ma-Fond-Blanc@2x.png 1197w\" sizes=\"(max-width: 800px) 100vw, 800px\" width=\"800\" height=\"856\">\n\n<figcaption><\/figcaption><\/figure>\n<strong>GANs bestehen aus zwei Modellen: Generator und Discriminator<\/strong>. Der Generator lernt, falsche Bilder zu erzeugen, die realistisch aussehen, um den Diskriminator zu t\u00e4uschen, und der Diskriminator lernt, falsche von echten Bildern zu unterscheiden.\n\nDer Generator darf keine echten Bilder sehen und kann daher in der Startphase schlechte Ergebnisse liefern, w\u00e4hrend der Diskriminator echte Bilder sehen darf, die aber mit den vom Generator erzeugten falschen Bildern vermischt werden, die er als echt oder falsch einstufen muss.\n\nIn den Generator wird ein gewisses Rauschen eingebracht, damit er in der Lage ist, jedes Mal andere Beispiele und nicht denselben Bildtyp zu erzeugen. Auf der Grundlage der vom Diskriminator vorhergesagten Punktzahlen versucht der Generator, seine Ergebnisse zu verbessern. Nach einiger Zeit wird der Generator in der Lage sein, Bilder zu produzieren, die schwerer zu unterscheiden sind. Auch der Diskriminator wird besser, da er dem Generator mit jeder Runde immer realistischere Bilder entlockt.\n\nDie beliebtesten Arten von<a href=\"https:\/\/liora.io\/de\/was-ist-ein-conditional-generative-adversarial-network-cgan\"><strong> GANs sind Deep Convolutional GANs (DCGAN), Conditional GANs (cGAN), StyleGANs, CycleGANs etc.<\/strong><\/a>\n\nGANs eignen sich hervorragend f\u00fcr die Erzeugung und Manipulation von Bildern: Gesichtsalterung, Mischen von Fotos, Superaufl\u00f6sung, Malen von Fotos, \u00dcbersetzen von Kleidung.\n<h3>Fazit<\/h3>\nEs gibt viele Techniken der Bildbearbeitung, und wie in vielen F\u00e4llen heutzutage, kann man mit neuronalen Netzen viele Informationen und sehr genaue Schlussfolgerungen erhalten. Python ist die Sprache der Wahl f\u00fcr diese Art von Aufgaben, mit Tools wie OpenCv, Scikit Image, <a href=\"https:\/\/liora.io\/de\/tensorflow-installieren-mit-anaconda-auf-macos\">Tensorflow<\/a> oder <a href=\"https:\/\/liora.io\/de\/pytorch\">Pytorch.<\/a>\n\nDie von Liora angebotenen Kurse bieten zahlreiche Tools, um zu lernen, wie man Daten in Bildform verarbeitet und wie man die komplexesten <strong>neuronalen Netze verwendet.<\/strong>\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Liora Weiterbildungen<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Bilder enthalten viele wichtige Informationen. W\u00e4hrend sie f\u00fcr unsere ge\u00fcbten Augen leicht zu erkennen sind, stellen sie eine echte Herausforderung f\u00fcr die Datenanalyse dar. Die Gesamtheit dieser Techniken ist unter dem Namen &#8222;Image Processing&#8220; oder Bildverarbeitung bekannt. In diesem Artikel erf\u00e4hrst du mehr \u00fcber die klassischen Algorithmen, Techniken und Werkzeuge zur Verarbeitung von Daten in [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":172704,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-172692","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/172692","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=172692"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/172692\/revisions"}],"predecessor-version":[{"id":217661,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/172692\/revisions\/217661"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/172704"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=172692"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=172692"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}