{"id":163673,"date":"2022-10-07T01:30:09","date_gmt":"2022-10-07T00:30:09","guid":{"rendered":"https:\/\/liora.io\/de\/?p=163673"},"modified":"2026-02-06T07:08:19","modified_gmt":"2026-02-06T06:08:19","slug":"adversarial-training","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/adversarial-training","title":{"rendered":"Adversarial Training"},"content":{"rendered":"<p><strong>Dank der Fortschritte im Bereich des Machine Learning und insbesondere des Deep Learning mit tiefen neuronalen Netzen sind Fehler seit den 2010er Jahren immer seltener geworden. Heute sind sie sogar sehr au\u00dfergew\u00f6hnlich. Dennoch machen diese Modelle manchmal immer noch Fehler, ohne dass es Forschern und Forscherinnen gelingt, wirksame Abwehrsysteme zu entwickeln.<\/strong><\/p>\n<b>Adversarial Examples<\/b> (dt. feindliche Beispiele) geh\u00f6ren zu diesen Inputs, die vom Modell falsch einordnen wird. Deshalb wurde eine Verteidigungstechnik entwickelt, die Adversarial Training oder feindliches Training genannt wird. Aber wie funktioniert diese Abwehrtechnik? Ist sie wirklich effektiv?\n<h3>Was ist ein Adversarial Example?<\/h3>\nAdversarial Training ist eine Technik, die entwickelt wurde, um Machine-Learning-Modelle vor Adversarial Examples zu sch\u00fctzen. Aber was sind Adversarial Examples denn? Es handeln sich dabei um sehr leicht und klug gest\u00f6rte Inputs (wie ein Bild, ein Text, ein Ton), die f\u00fcr den Menschen nicht wahrnehmbar sind, aber von einem Machine-Learning-Modell falsch klassifiziert werden.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"512\" height=\"203\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/09\/unnamed-1.webp\" alt=\"\" loading=\"lazy\"><figcaption>Klassifizierung eines Panda-Bildes mithilfe eines adversarial network  <\/figcaption><\/figure>\nDas Verbl\u00fcffende an diesen Angriffen ist die Sicherheit, die das Modell bei seiner falschen Vorhersage hat. Im obigen Beispiel ist es deutlich: Das Modell l\u00e4sst f\u00fcr die richtige Vorhersage nur 57,7% Vertrauen zu, f\u00fcr die falsche Vorhersage hingegen ein sehr hohes Vertrauen von 99,3%. Wenn Du mehr \u00fcber diese erstaunlichen Angriffe erfahren m\u00f6chtest, kannst Du <strong><a href=\"https:\/\/liora.io\/adversarial-attack-quest-ce-que-cest-et-comment-proteger-lia-contre-cette-menace\">den entsprechenden Artikel lesen.<\/a><\/strong>\n\nDiese Angriffe sind sehr problematisch. Beispielsweise zeigt <strong><a href=\"https:\/\/www.science.org\/doi\/10.1126\/science.aaw4399\">ein 2019 in Science ver\u00f6ffentlichter Artikel von Forschenden der Harvard University und des MIT<\/a><\/strong>, wie medizinische KI-Systeme anf\u00e4llig f\u00fcr feindliche Angriffe sein k\u00f6nnten. Aus diesem Grund ist es notwendig, sich zu verteidigen. An dieser Stelle kommt das Adversarial Training ins Spiel. Es ist neben der \u201eDefensive Distillation\u201c die wichtigste Technik, um sich vor solchen Angriffen zu sch\u00fctzen.\n<h3>Wie funktioniert das Adversarial Training?<\/h3>\nWie funktioniert diese Technik? Es geht darum, das Machine-Learning-Modell mit vielen Adversarial Examples neu zu trainieren. Wenn der Input vom Machine-Learning-Modell in der Trainingsphase eines Vorhersagemodells n\u00e4mlich falsch klassifiziert wird, lernt der Algorithmus aus seinen Fehlern und passt seine Parameter neu an, mit dem Ziel, diese Fehler nicht mehr zu begehen.\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"512\" height=\"275\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/09\/unnamed.webp\" alt=\"\" loading=\"lazy\">\n\n<figcaption>Veranschaulichung eines Adversarial Trainings<\/figcaption><\/figure>\nNachdem das Modell also ein erstes Mal trainiert wurde, werden die Entwickler des Modells zahlreiche Adversarial Examples generieren. Sie werden ihr eigenes Modell mit diesen widerspr\u00fcchlichen Beispielen konfrontieren, damit es diese Fehler nicht mehr macht.\n\nWenn diese Methode die Machine-Learning-Modelle gegen bestimmte Adversarial Examples verteidigt, kann sie dann die Robustheit des Modells auf alle Adversarial Examples verallgemeinern? Leider nicht. Dieser Ansatz reicht insgesamt nicht aus, um alle Angriffe zu stoppen, da das Spektrum der m\u00f6glichen Angriffe zu weit ist und nicht im Voraus generiert werden kann. Daher handelt es sich oft um einen Wettlauf zwischen Hackern, die neue adversarial examples generieren, und Entwicklern, die sich so schnell wie m\u00f6glich davor sch\u00fctzen.\n\nAllgemeiner gesagt ist es sehr schwierig, Modelle vor Adversarial Examples zu sch\u00fctzen, da es nahezu unm\u00f6glich ist, ein theoretisches Modell der Entwicklung dieser Beispiele zu erstellen. Hierbei m\u00fcssten besonders komplexe Optimierungsprobleme gel\u00f6st werden, und wir verf\u00fcgen nicht \u00fcber die notwendigen theoretischen Werkzeuge.\n\nAlle bisher getesteten Strategien scheitern, weil sie nicht anpassungsf\u00e4hig sind: Sie k\u00f6nnen eine Art von Angriff blockieren, lassen aber eine andere Schwachstelle f\u00fcr einen Angriff offen, der die verwendete Verteidigung kennt. Die Entwicklung einer Verteidigung, die vor einem starken, anpassungsf\u00e4higen Hacker sch\u00fctzen kann, ist ein wichtiges Forschungsgebiet.\n\nZusammenfassend l\u00e4sst sich sagen, dass das Adversarial Training insgesamt beim Schutz von Machine-Learning-Modellen vor <b>Adversarial Attacks<\/b> versagt. Diese Technik bietet eine Verteidigung gegen eine Reihe von bestimmten Angriffen, ohne dass es ihr gelingt, eine allgemeine Methode herauszuarbeiten. M\u00f6chtest Du mehr \u00fcber die Herausforderungen der k\u00fcnstlichen Intelligenz erfahren? M\u00f6chtest Du die in diesem Artikel erw\u00e4hnten Techniken des Deep Learning beherrschen? <a href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\"><strong>Informiere Dich \u00fcber unsere Weiterbildung&nbsp;<\/strong><\/a>\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Entdecke den Kurs zum\/r Data Scientist<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Dank der Fortschritte im Bereich des Machine Learning und insbesondere des Deep Learning mit tiefen neuronalen Netzen sind Fehler seit den 2010er Jahren immer seltener geworden. Heute sind sie sogar sehr au\u00dfergew\u00f6hnlich. Dennoch machen diese Modelle manchmal immer noch Fehler, ohne dass es Forschern und Forscherinnen gelingt, wirksame Abwehrsysteme zu entwickeln. Adversarial Examples (dt. feindliche [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":163675,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-163673","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/163673","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=163673"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/163673\/revisions"}],"predecessor-version":[{"id":217766,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/163673\/revisions\/217766"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/163675"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=163673"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=163673"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}