{"id":150953,"date":"2026-01-28T16:44:42","date_gmt":"2026-01-28T15:44:42","guid":{"rendered":"https:\/\/multi.liora.io\/?p=150953"},"modified":"2026-02-25T18:55:31","modified_gmt":"2026-02-25T17:55:31","slug":"vgg-modell-data-weiterbildung","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/vgg-modell-data-weiterbildung","title":{"rendered":"VGG: Was ist das f\u00fcr ein Modell? Daniel verr\u00e4t es Dir!"},"content":{"rendered":"<p><strong>Daniel ist wieder da, die Symbolfigur unserer Weiterbildungen, die unsere Lernenden bis zum Abschluss begleitet. Heute wird er Dir ein Modell vorstellen, das h\u00e4ufig in der Computer Vision verwendet wird: VGG.\n<\/strong><\/p>\t\t\n\t\t<p>Vor einiger Zeit hatten wir bereits die Gelegenheit, das Konzept des <a href=\"https:\/\/liora.io\/de\/transfer-learning\">Transfer Learning<\/a> n\u00e4her zu erl\u00e4utern. Wenn Du unseren Artikel zu diesem Thema verpasst hast, kannst Du ihn <strong><a href=\"https:\/\/liora.io\/de\/convolutional-neural-network-2\">hier<\/a> <\/strong>noch einmal anschauen. Kurz erkl\u00e4rt, bezeichnet Transfer Learning die F\u00e4higkeit, vorhandenes Wissen, das zur L\u00f6sung bestimmter Probleme entwickelt wurde, zur L\u00f6sung eines neuen Problems zu nutzen.&nbsp;<\/p>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-ein-paar-hintergrundinformationen\">Ein paar Hintergrundinformationen\n<\/h2>\t\t\n\t\t<p><a href=\"https:\/\/liora.io\/de\/neuronale-netze-einfach-erklaert\">VGG ist ein neuronales Netz aus Faltungszellen,<\/a> das von K. Simonyan und A. Zisserman von der Universit\u00e4t Oxford entwickelt wurde und das durch den Gewinn des <b>ILSVRC<\/b>-Wettbewerbs (<b>ImageNet Large Scale Visual Recognition Challenge<\/b>) im Jahr 2014 Ber\u00fchmtheit erlangte. Das Modell erreichte auf Imagenet eine Genauigkeit von 92,7 %, was einen der h\u00f6chsten Werte darstellt. Es stellte einen Fortschritt gegen\u00fcber fr\u00fcheren Modellen dar, indem es in den Faltungsmatrixen <b>kleinere Faltungskerne (3\u00d73)<\/b> nutzte als bis dahin \u00fcblich. Das Modell wurde \u00fcber Wochen hinweg mithilfe modernster Grafikkarten trainiert.&nbsp;<\/p>\t\t\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Erfahre mehr \u00fcber unsere Weiterbildung zum Data Scientist<\/a><\/div><\/div>\n\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-imagenet\">ImageNet\n<\/h2>\t\t\n\t\t<p>ImageNet ist eine gigantische <b>Datenbank <\/b>mit \u00fcber 14 Millionen gelabelten Bildern, die in \u00fcber 1000 Klassen eingeteilt sind, Stand 2014. Im Jahr 2007 begann eine Forscherin namens Fei-Fei Li mit dem Projekt, einen solchen Datensatz zu erstellen. Zwar ist die Modellierung ein sehr wichtiger Aspekt, um eine gute Leistung zu erzielen, aber \u00fcber qualitativ hochwertige Daten zu verf\u00fcgen, ist ebenso wichtig, um ein erstklassiges Lernergebnis zu erzielen. Die Daten wurden von Menschen aus dem Internet gesammelt und mit Tags versehen. Sie sind daher Open Source und geh\u00f6ren somit keinem bestimmten Unternehmen. <\/p><p>&nbsp;<\/p><p>? Auch interessant:<\/p><table dir=\"ltr\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\"><colgroup><col width=\"1116\"><\/colgroup><tbody><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Was genau ist ein Deep Neural Network?&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/deep-neural-network\"><a href=\"https:\/\/liora.io\/de\/deep-neural-network\" target=\"_blank\" rel=\"noopener\">Was genau ist ein Deep Neural Network?<\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Recurrent Neural Network (RNN): Was genau ist das?&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/recurrent-neural-network\"><a href=\"https:\/\/liora.io\/de\/recurrent-neural-network\" target=\"_blank\" rel=\"noopener\">Recurrent Neural Network (RNN): Was genau ist das?<\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Convolutional Neural Network (CNN): Alles, was Du wissen solltest&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/convolutional-neural-network-2\"><a href=\"https:\/\/liora.io\/de\/convolutional-neural-network-2\" target=\"_blank\" rel=\"noopener\">Convolutional Neural Network (CNN): Alles, was Du wissen solltest<\/a><\/td><\/tr><\/tbody><\/table><p>Seit 2010 findet jedes Jahr die <b>ImageNet Large Scale Visual Recognition Challenge<\/b> statt, bei der es darum geht, Modelle der Bildverarbeitung herauszufordern. Der Wettbewerb wird auf einer Teilmenge des ImageNet durchgef\u00fchrt, die aus : 1,2 Millionen Trainingsbildern, 50.000 zur Validierung und 150.000 zum Testen des Modells.&nbsp;<\/p>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-die-architektur\">Die Architektur<\/h2>\t\t\n\t\t<p>In der Praxis gibt es zwei verschiedene Algorithmen: <b>VGG16 <\/b>und <b>VGG19<\/b>. In diesem Artikel werden wir uns auf die Architektur des ersteren konzentrieren. Obwohl beide Architekturen sehr \u00e4hnlich sind und der gleichen Logik folgen, weist VGG19 eine gr\u00f6\u00dfere Anzahl von Faltungsmatrixen auf.&nbsp;<\/p>\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"800\" height=\"439\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2021\/04\/illu_VGG_Plan-de-travail-1.png\" alt=\"Architecture Algoritme VGG16\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t<figcaption>Architecture Algoritme VGG16<\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\t\t\t\t\t\t\t\t\t<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"800\" height=\"439\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2021\/04\/illu_VGG-02.png\" alt=\"Structure VGG 16\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t<figcaption>Structure Algoritme VGG16<\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Erfahre mehr \u00fcber unsere Weiterbildung zum Data Scientist<\/a><\/div><\/div>\n\n\t\t<p>Das Modell erfordert nur eine spezifische Vorverarbeitung, bei der der durchschnittliche RGB-Wert, der \u00fcber den Lernsatz berechnet wurde, von jedem Pixel subtrahiert wird.<\/p><p>W\u00e4hrend des Lernens des Modells ist der Input f\u00fcr die erste Faltungsschicht ein RGB-Bild der Gr\u00f6\u00dfe 224 x 224. F\u00fcr alle Faltungsschichten ist die Faltungsmatrix 3\u00d73 gro\u00df: die kleinste Dimension, um die Konzepte von oben, unten, links\/rechts und mittig zu erfassen. Dies war eine Besonderheit des Modells zum Zeitpunkt seiner Ver\u00f6ffentlichung. Bis zur Markteinf\u00fchrung von VGG16 haben sich viele Modelle f\u00fcr gr\u00f6\u00dfere Faltungskerne entschieden (z. B. Gr\u00f6\u00dfe 11 oder Gr\u00f6\u00dfe 5). Diese Schichten haben zum Ziel, das Bild zu filtern, indem sie nur diskriminierende Informationen wie atypische geometrische Formen filtern.&nbsp;&nbsp;<\/p><p>Diese Faltungsschichten werden von <a href=\"https:\/\/liora.io\/de\/convolutional-neural-network-2\">Max-Pooling-Schichten<\/a>&nbsp;begleitet, die jeweils eine Gr\u00f6\u00dfe von 2\u00d72 haben, um die Gr\u00f6\u00dfe der Filter w\u00e4hrend des Lernens zu reduzieren.&nbsp;&nbsp;<\/p><p>Am Output der Convolution- und Pooling-Schichten haben wir 3 Schichten von <b>Fully-Connected-Neuronen<\/b>. Die ersten beiden bestehen aus 4096 Neuronen und die letzte aus 1000 Neuronen mit einer Softmax-Aktivierungsfunktion, um die Klasse des Bildes zu bestimmen.<\/p><p>Wie Du siehst, ist die Architektur klar und einfach zu verstehen, was auch eine St\u00e4rke dieses Modells darstellt.&nbsp;<\/p>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-ergebnisse-aus-dem-imagenet\">Ergebnisse aus dem ImageNet<\/h2>\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"602\" height=\"259\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2021\/04\/image2-1.png\" alt=\"\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t<p>Die obige Abbildung vergleicht die Ergebnisse verschiedener Modelle aus dem Jahr 2014 oder auch aus fr\u00fcheren Jahren. Wir k\u00f6nnen sehen, dass VGG sowohl im Validierungs- als auch im Testsatz die besten Ergebnisse liefert. Bemerkenswert ist auch, dass das Modell deutlich bessere Ergebnisse liefert als in den Jahren 2012 und 2013.&nbsp;<\/p>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-was-hat-transfer-learning-mit-all-dem-zu-tun\">Was hat Transfer Learning mit all dem zu tun?<\/h2>\t\t\n\t\t<p>Wie bereits erw\u00e4hnt, kann die <a href=\"https:\/\/liora.io\/de\/transfer-learning\">Trainingszeit f\u00fcr ein Modell wie VGG sehr lang sein,<\/a> vor allem, wenn man nur wenige Ressourcen zur Verf\u00fcgung hat. Da das Modell im ImageNet trainiert wurde, kann es au\u00dferdem interessant sein, die Gewichte des bereits trainierten Modells abzurufen, insbesondere die Filter in den Faltungsschichten, die aus dem Training im ImageNet stammen. In der Praxis wird dies auch so gehandhabt: Wir rufen die Gewichte aus den Faltungsschichten ab und m\u00fcssen nur die drei Schichten trainieren, die wir hinzuf\u00fcgen. Das Prinzip bleibt das gleiche: das in ImageNet gewonnene Wissen zur L\u00f6sung eines naheliegenden Problems zu nutzen.<\/p><p>Insbesondere ist es m\u00f6glich, das vorab trainierte Modell sehr einfach direkt abzurufen und die spezifische Vorverarbeitung anzuwenden, die das Modell verlangt.&nbsp;<\/p>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-ein-kleiner-einblick-in-die-praxis\">Ein kleiner Einblick in die Praxis<\/h2>\t\t\n\t\t<p>In der Praxis gibt es zwei verf\u00fcgbare Algorithmen: VGG16 und VGG19.&nbsp;<\/p><p>Mit Hilfe der <a href=\"https:\/\/liora.io\/de\/tensorflow\"><b>keras-Bibliothek von Tensorflow<\/b> ist es einfach,<\/a> das bereits trainierte Modell standardm\u00e4\u00dfig von ImageNet abzurufen.&nbsp;<\/p><p>Zun\u00e4chst m\u00fcssen wir die gleiche spezifische Verarbeitung anwenden, die zum Zeitpunkt des Trainings des Modells angewandt wurde. Dar\u00fcber hinaus erg\u00e4nzen wir die Trainingsdaten durch zus\u00e4tzliche Daten, um ein Risiko des <b>Overlearnings <\/b>zu verhindern. Dabei ist es auch wichtig, zu \u00fcberpr\u00fcfen, ob die als Input gegebenen Bilder RGB-Bilder im Format 224\u00d7224 sind.&nbsp;&nbsp;<\/p><p>Dann k\u00f6nnen wir die optimierten Gewichte aus den Faltungsschichten abrufen und die drei Dense Layer trainieren, die wir hinzuf\u00fcgen und zusammensetzen:&nbsp;<\/p><p>Wenn die Ergebnisse nach dem Training nicht gut genug sind, ist es nicht mehr m\u00f6glich, die letzten Faltungsmatrixen zu fixieren und sie erneut zu trainieren, um eine bessere Leistung zu erzielen. Auch hier h\u00e4ngt alles von den zur Verf\u00fcgung stehenden Ressourcen ab, sodass sich dieser zus\u00e4tzliche Schritt als zeitaufwendig herausstellen kann.&nbsp;<\/p><p>&nbsp;<\/p><p>?Auch interessant:<\/p><table dir=\"ltr\" border=\"1\" cellspacing=\"0\" cellpadding=\"0\"><colgroup><col width=\"1116\"><\/colgroup><tbody><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Microsoft pr\u00e4sentiert Windows Copilot: Erfahre alles \u00fcber die Revolution des Betriebssystems &quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/microsoft-praesentiert-windows-copilot-erfahre-alles-ueber-die-revolution-des-betriebssystems\"><a href=\"https:\/\/liora.io\/de\/microsoft-praesentiert-windows-copilot-erfahre-alles-ueber-die-revolution-des-betriebssystems\" target=\"_blank\" rel=\"noopener\">Microsoft pr\u00e4sentiert Windows Copilot: Erfahre alles \u00fcber die Revolution des Betriebssystems <\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Data Visualization Tools: Gebe deinen Daten einen Sinn! &quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/data-visualization-tools-gebe-deinen-daten-einen-sinn-2\"><a href=\"https:\/\/liora.io\/de\/data-visualization-tools-gebe-deinen-daten-einen-sinn-2\" target=\"_blank\" rel=\"noopener\">Data Visualization Tools: Gebe deinen Daten einen Sinn! <\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Bootstrap: Was ist das? Wie kann man damit eine Webseite erstellen? &quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/bootstrap-was-ist-das-wie-kann-man-damit-eine-webseite-erstellen\"><a href=\"https:\/\/liora.io\/de\/bootstrap-was-ist-das-wie-kann-man-damit-eine-webseite-erstellen\" target=\"_blank\" rel=\"noopener\">Bootstrap: Was ist das? Wie kann man damit eine Webseite erstellen? <\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Walaaxy: Alles \u00fcber das LinkedIn-Prospektionstool &quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/walaaxy-alles-ueber-das-linkedin-prospektionstool\"><a href=\"https:\/\/liora.io\/de\/walaaxy-alles-ueber-das-linkedin-prospektionstool\" target=\"_blank\" rel=\"noopener\">Walaaxy: Alles \u00fcber das LinkedIn-Prospektionstool <\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;5G, Blockchain, VR\u2026 Eine neue Datenwelle! &quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/5g-blockchain-vr-eine-neue-datenwelle\"><a href=\"https:\/\/liora.io\/de\/5g-blockchain-vr-eine-neue-datenwelle\" target=\"_blank\" rel=\"noopener\">5G, Blockchain, VR\u2026 Eine neue Datenwelle! <\/a><\/td><\/tr><tr><td data-sheets-value=\"{&quot;1&quot;:2,&quot;2&quot;:&quot;Customer Data Platform (CDP): Definition und Vorteile&quot;}\" data-sheets-hyperlink=\"https:\/\/liora.io\/de\/customer-data-platform-cdp-definition-und-vorteile\"><a href=\"https:\/\/liora.io\/de\/customer-data-platform-cdp-definition-und-vorteile\" target=\"_blank\" rel=\"noopener\">Customer Data Platform (CDP): Definition und Vorteile<\/a><\/td><\/tr><\/tbody><\/table>\t\t\n\t\t\t<h2 class=\"wp-block-heading\" id=\"h-zusammenfassung\">Zusammenfassung<\/h2>\t\t\n\t\t<p>VGG ist ein bekannter Algorithmus in der <b>Computer Vision<\/b>, der sehr oft durch Lerntransfer eingesetzt wird, um ein erneutes Training zu vermeiden und \u00e4hnliche Probleme zu l\u00f6sen, auf die VGG bereits trainiert wurde. Es gibt noch viele andere Algorithmen des gleichen Typs wie VGG, wie z. B. <b>ResNet<\/b> oder <b>Xception<\/b>, die in der Keras-Bibliothek verf\u00fcgbar sind. Wenn Du Dich im Bereich Deep Learning und Computer Vision weiterbilden m\u00f6chtest, dann nimm an unserem Intensivkurs oder unserem berufsbegleitenden Kurs teil.&nbsp;<\/p>\t\t\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Werde Data Scientist<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Daniel ist wieder da, die Symbolfigur unserer Weiterbildungen, die unsere Lernenden bis zum Abschluss begleitet. Heute wird er Dir ein Modell vorstellen, das h\u00e4ufig in der Computer Vision verwendet wird: VGG.<\/p>\n","protected":false},"author":85,"featured_media":219765,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-150953","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/150953","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/85"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=150953"}],"version-history":[{"count":4,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/150953\/revisions"}],"predecessor-version":[{"id":219766,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/150953\/revisions\/219766"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/219765"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=150953"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=150953"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}