{"id":184383,"date":"2023-08-25T18:41:53","date_gmt":"2023-08-25T17:41:53","guid":{"rendered":"https:\/\/liora.io\/de\/?p=184383"},"modified":"2026-02-06T06:19:35","modified_gmt":"2026-02-06T05:19:35","slug":"gan-machine-learning-praktische-anwendung-mit-fiktiven-gesichtern","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/gan-machine-learning-praktische-anwendung-mit-fiktiven-gesichtern","title":{"rendered":"GAN Machine Learning: Praktische Anwendung mit fiktiven Gesichtern"},"content":{"rendered":"<p><img decoding=\"async\" width=\"800\" height=\"796\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso1.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso1.png 939w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso1-300x298.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso1-150x150.png 150w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso1-768x764.png 768w\" sizes=\"(max-width: 800px) 100vw, 800px\"><br \/>\n<img decoding=\"async\" width=\"512\" height=\"511\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso2.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso2.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso2-300x300.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso2-150x150.png 150w\" sizes=\"(max-width: 512px) 100vw, 512px\"><br \/>\n<img decoding=\"async\" width=\"512\" height=\"510\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso3.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso3.png 512w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso3-300x300.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/perso3-150x150.png 150w\" sizes=\"(max-width: 512px) 100vw, 512px\"><\/p>\n<p><strong>GAN Machine Learning: Was haben diese drei Personen gemeinsam? Keine von ihnen existiert im wirklichen Leben und jedes dieser Fotos wurde von dieser Website generiert. Aber wie kann diese Seite es schaffen, so fotorealistische und unterschiedliche Personen zu generieren?<\/strong><\/p>\n<p>Dank des <strong>StyleGAN2-Algorithmus<\/strong>, der von einem Forscherteam von<strong> NVIDIA<\/strong> entwickelt wurde! Dieser noch sehr neue <a href=\"https:\/\/liora.io\/de\/algorithmus-was-ist-das-wozu-dient-er\">Algorithmus<\/a> (Februar 2019) baut auf einer ersten Version auf, die das Team 2018 ver\u00f6ffentlicht hat, und basiert selbst auf der<a href=\"https:\/\/liora.io\/de\/stiluebertragung-mit-cyclegan\"> GAN-Architektur.<\/a><\/p>\n<h3>GAN Machine Learning &#8211;  Was ist ein GAN?<\/h3>\n<p>Ein <strong>GAN (Generative Adversarial Network)<\/strong> ist ein sehr effektiver, nicht \u00fcberwachter Lernalgorithmus, der bei bestimmten Problemen der Computervision weit verbreitet ist.<\/p>\n<p>Es ist insbesondere diese Art von <strong>maschinellem Lernalgorithmus<\/strong>, der verwendet wird, um die <a href=\"https:\/\/liora.io\/de\/kuenstliche-intelligenz-deepfake-detector-sind-inzwischen-unentbehrlich-geworden\">Deepfakes<\/a> zu erstellen, die wir in einem unserer vorherigen Artikel besprochen haben.<\/p>\n<p>Konkret besteht ein <strong>GAN<\/strong> aus zwei neuronalen Netzen, die gleichzeitig gegeneinander trainieren, um falsche Bilder zu erzeugen.<\/p>\n<p>Das erste ist der <strong>Generator (G)<\/strong>, der aus einem zuf\u00e4lligen Rauschvektor (z) falsche Bilder von Gesichtern erzeugt. Dies erm\u00f6glicht es dem Algorithmus, bei jeder neuen Iteration ein anderes Gesicht zu erzeugen.<\/p>\n<p>Der <strong>Diskriminator (D)<\/strong> hingegen lernt, zwischen den vom Generator erzeugten falschen Bildern und dem echten Leben zu unterscheiden. In der Praxis ist er also ein Klassifizierer.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t\t<a href=\"https:\/\/theconversation.com\/competition-entre-reseaux-de-neurones-artificiels-pour-creer-des-images-realistes-110005\" target=\"_blank\" rel=\"noopener\"><br \/>\n<img decoding=\"async\" width=\"800\" height=\"449\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-4-1024x575.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-4-1024x575.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-4-300x169.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-4-768x431.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-4.png 1200w\" sizes=\"(max-width: 800px) 100vw, 800px\">\t\t\t\t\t\t\t\t<\/a><figcaption>Quelle:The conversation<\/figcaption><\/figure>\n<p>Zu Beginn wird keines der <strong>beiden Netzwerke<\/strong> trainiert. W\u00e4hrend des Trainings wird der Diskriminator sowohl mit realen Bildern als auch mit Bildern aus dem <a href=\"https:\/\/liora.io\/de\/deep-convolutional-gan-was-ist-das\">Generator konfrontiert.<\/a> Sein Ziel ist es dann, die Herkunft jedes Bildes zu unterscheiden. Parallel dazu lernt der Generator, ein Bild zu erzeugen, das den Diskriminator t\u00e4uschen kann. Mit der Zeit wird der Generator immer besser darin, realistische Bilder zu erzeugen, w\u00e4hrend es dem Diskriminator gelingt, Fehler in den immer leichteren gef\u00e4lschten Bildern zu finden.<\/p>\n<p>Durch diesen adversen Lernprozess kann das neuronale Netz lernen, so realistisch Fotografien von Menschen zu erstellen.<\/p>\n<h4>GAN Machine Learning: Woher kommt GAN?<\/h4>\n<p><a href=\"https:\/\/liora.io\/de\/kuenstliche-intelligenz\">K\u00fcnstliche Intelligenz<\/a> hat riesige Fortschritte gemacht, wenn es darum geht, Objekte in einem Bild zu identifizieren.<\/p>\n<p>Die KI ist z. B. auch in der Lage, die Regeln eines Spiels zu entwirren, indem sie tausende Male gegen sich selbst spielt. Problematisch wird es jedoch, wenn man von einer <strong>KI<\/strong> verlangt, etwas Neues zu schaffen, etwas, das es vorher nicht gab. Denn die KI kann zwar unsere <strong>Intelligenz simulieren,<\/strong> aber nicht unsere Vorstellungskraft.<\/p>\n<p>W\u00e4hrend einer Diskussion in einer Bar mit anderen Doktoranden im Jahr 2014 hatte ein Student der Universit\u00e4t Montreal namens Ian Goodfellow eine Idee, wie man diese H\u00fcrde \u00fcberwinden k\u00f6nnte.<\/p>\n<p>Wie fast alles in der Wissenschaft lie\u00df sich der junge Mann von fr\u00fcheren Forschungen inspirieren, wie den von J\u00fcrgen Schmidhuber in den 1990er Jahren ver\u00f6ffentlichten Arbeiten \u00fcber &#8222;Predictability Minimization&#8220; (Verringerung der Vorhersagbarkeit) und &#8222;Artificial Curiosity&#8220; (k\u00fcnstliche Neugier) sowie dem Konzept des &#8222;Turing-Learning&#8220;.<\/p>\n<h4>GAN Machine Learning: Wozu dient GAN?<\/h4>\n<p>Eine der neuesten und \u00fcberraschendsten Anwendungen dieser Technologie, die es erm\u00f6glicht, &#8222;<a href=\"https:\/\/liora.io\/de\/gesichtserkennung-entschluesselung-ihrer-funktionsweise\">ein Gesicht auf ein anderes zu setzen<\/a>&#8222;, ist die Generierung von falschen menschlichen Gesichtern wie das von Nvidia entwickelte <strong>DCGAN<\/strong>. Dieser erm\u00f6glicht es nun, hyperrealistische (oder fast hyperrealistische) Gesichter zu erzeugen, die keiner echten Person entsprechen.<\/p>\n<p>Auf der Grundlage dieser Technologie wurden auch mehrere Webgeneratoren entwickelt. Sie beschr\u00e4nken sich nicht auf Gesichter, sondern verwenden Manga-Figuren oder Katzen.<\/p>\n<p>Aber der Nutzen eines <a href=\"https:\/\/liora.io\/de\/deep-convolutional-gan-was-ist-das\">GAN<\/a> beschr\u00e4nkt sich nicht nur auf Bilder. Es kann auch in Videos verwendet werden, wie im Fall der umstrittenen Deepfakes.<\/p>\n<p><strong>Goodfellow<\/strong> ist jedoch davon \u00fcberzeugt, dass seine Kreation der Menschheit noch viel mehr bieten kann.<\/p>\n<p><strong>GAN<\/strong> hat das Potenzial, Gegenst\u00e4nde zu erzeugen, die wir in der realen Welt verwenden k\u00f6nnen. In einer nicht allzu fernen Zukunft k\u00f6nnte GAN in verschiedenen Disziplinen eingesetzt werden, z. B. bei der Entwicklung von Medikamenten, schnelleren Chips, erdbebensicheren Geb\u00e4uden, effizienteren Fahrzeugen oder kosteng\u00fcnstigen Geb\u00e4uden.<\/p>\n<p>Dabei ist zu ber\u00fccksichtigen, dass diese Technologie noch in den Kinderschuhen steckt.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/weiterbildung-deep-learning\"><br \/>\nEntdecke unsere Deep Learning Ausbildung<br \/>\n<\/a><\/p>\n<h3>Die Verbesserungen des StyleGAN<\/h3>\n<p>Die <strong>GAN-Architektur<\/strong> weist jedoch noch einige Einschr\u00e4nkungen auf:<\/p>\n<ul>\n<li>Es ist schwierig, hochaufl\u00f6sende Bilder f\u00fcr <a href=\"https:\/\/liora.io\/de\/stiluebertragung-mit-cyclegan\">GAN<\/a> zu erzeugen. Dies liegt daran, dass die Anzahl der Parameter, die von Anfang an gelernt werden m\u00fcssen, besonders hoch ist.<\/li>\n<li>Den erzeugten Bildern fehlte es an Vielfalt. GANs sind ziemlich anf\u00e4llig f\u00fcr den so genannten &#8218;collapse mode&#8216;.<\/li>\n<li>Das hei\u00dft, dass der Generator immer die gleichen Bilder erzeugt, die es schaffen, den Diskriminator zu t\u00e4uschen.<\/li>\n<li>Schlie\u00dflich kann man die Ausgabeeigenschaften der erzeugten Bilder nicht kontrollieren.<\/li>\n<\/ul>\n<p>Durch <strong>Progressive Growing<\/strong> oder allm\u00e4hliches Wachstum k\u00f6nnen die Aufl\u00f6sungsbeschr\u00e4nkungen gel\u00f6st werden. Konkret bedeutet adaptives Growing, dass das Modell auf Bildern mit steigender Aufl\u00f6sung trainiert wird. W\u00e4hrend des Lernens werden dem Generator und Diskriminator weitere Schichten hinzugef\u00fcgt, um mit Bildern mit h\u00f6herer Aufl\u00f6sung zu arbeiten und gleichzeitig die Vorteile des bereits erfolgten Lernens zu nutzen.<\/p>\n<p>Dar\u00fcber hinaus verbessert das Progressive Growing auch die Stabilit\u00e4t des Algorithmus und die Vielfalt der erzeugten Bilder.<\/p>\n<p><img decoding=\"async\" width=\"605\" height=\"379\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-5.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-5.png 605w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2023\/08\/pasted-image-0-5-300x188.png 300w\" sizes=\"(max-width: 605px) 100vw, 605px\"><\/p>\n<p>Um die Eigenschaften der erzeugten Bilder zu kontrollieren, versucht man, den Rauschvektor (z) mit den gew\u00fcnschten<strong> Eigenschaften zu dekorrelieren (disentangle).<\/strong><\/p>\n<p>Stell dir vor, du m\u00f6chtest eine Person mit Brille erzeugen: Wenn du nur einen Wert des Rauschvektors \u00e4nderst, kann das viele verschiedene Ver\u00e4nderungen hervorrufen. Das liegt daran, dass ein Rauschwert nicht direkt mit einem einzigen <strong>Merkmal des Bildes<\/strong> korreliert ist. Man versucht also, die Dimensionen des Rauschvektors mit den Bildfeatures zu entflechten.<\/p>\n<p>Die<strong> Entflechtung<\/strong> wird insbesondere dadurch erm\u00f6glicht, dass ein Zwischen-Rauschvektor in einem Unterraum erzeugt wird, in dem die Dimensionen entkorreliert sind.<\/p>\n<p>Schlie\u00dflich verwendet <strong>StyleGan<\/strong> weitere, komplexere Verbesserungen wie Adaptive Instance Normalization und<strong> Style Mixing.<\/strong><\/p>\n<h3>Fazit &#8211; GAN Machine Learning<\/h3>\n<p>Durch die Behebung einiger M\u00e4ngel des klassischen <strong>GAN<\/strong> haben <strong>StyleGAN<\/strong> und sein Nachfolger <strong>StyleGAN2<\/strong> den Stand der Technik f\u00fcr die Erzeugung realistischer Bilder durch <a href=\"https:\/\/liora.io\/de\/machine-learning-projekt-wie-bereite-ich-meine-umgebung-vor-bevor-ich-ein-projekt-beginne\">maschinelles Lernen<\/a> definiert.<\/p>\n<p>Es gibt jedoch noch einige Punkte, die verbessert werden m\u00fcssen, wie z. B. die Behandlung von Hintergr\u00fcnden.<\/p>\n<p>Auf dieser Website kannst du \u00fcben, Bilder zu erkennen, indem du den <strong>Diskriminator spielst.<\/strong><\/p>\n<p>Wenn du mehr \u00fcber <a href=\"https:\/\/liora.io\/de\/computer-vision\">Computer Vision<\/a> und k\u00fcnstliche Intelligenz, die auf Bilder angewandt wird, lernen m\u00f6chtest: Entdecke einen unserer Kurse.<\/p>\n<p><a href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\"><br \/>\nEntdecke unsere Weiterbildungen<br \/>\n<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>GAN Machine Learning: Was haben diese drei Personen gemeinsam? Keine von ihnen existiert im wirklichen Leben und jedes dieser Fotos wurde von dieser Website generiert. Aber wie kann diese Seite es schaffen, so fotorealistische und unterschiedliche Personen zu generieren? Dank des StyleGAN2-Algorithmus, der von einem Forscherteam von NVIDIA entwickelt wurde! Dieser noch sehr neue Algorithmus [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":184386,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-184383","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/184383","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=184383"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/184383\/revisions"}],"predecessor-version":[{"id":217208,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/184383\/revisions\/217208"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/184386"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=184383"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=184383"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}