{"id":165029,"date":"2023-02-02T20:33:43","date_gmt":"2023-02-02T19:33:43","guid":{"rendered":"https:\/\/liora.io\/de\/?p=165029"},"modified":"2026-02-06T07:05:26","modified_gmt":"2026-02-06T06:05:26","slug":"transfer-learning","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/transfer-learning","title":{"rendered":"Transfer Learning: Was ist das?"},"content":{"rendered":"<p>In diesem f\u00fcnften und letzten Teil unserer Serie \u00fcber Deep Learning erf\u00e4hrst du mehr \u00fcber die Definition und die Funktionsweise von Transfer Learning. Wenn du auf die ersten Artikel zur\u00fcckgreifen m\u00f6chtest, findest du hier eine Liste :<\/p>\n<ol>\n<li style=\"font-weight: 400\"><strong><a href=\"https:\/\/liora.io\/de\/deep-learning-oder-tiefes-lernen-was-ist-das-denn\">Einf\u00fchrung in Deep Learning<\/a><\/strong><\/li>\n<li style=\"font-weight: 400\"><strong><a href=\"https:\/\/liora.io\/de\/tiefes-lernen-netzwerk-von-biologischen-oder-k\u00fcnstlichen-neuronen\">Neuronale Netzwerke: biologisch oder k\u00fcnstlich<\/a><\/strong><\/li>\n<li style=\"font-weight: 400\"><strong><a href=\"https:\/\/liora.io\/de\/convolutional-neural-network-2\">&nbsp;Convolutional Neural Network<\/a><\/strong><\/li>\n<li style=\"font-weight: 400\"><strong>&nbsp;<a href=\"https:\/\/liora.io\/de\/neuronale-netze-einfach-erklaert\">Funktionsweise von Netzen neuronalen&nbsp;<\/a><\/strong><\/li>\n<li style=\"font-weight: 400\"><strong><a href=\"https:\/\/liora.io\/de\/transfer-learning\">Transfer Learning<\/a><\/strong><\/li>\n<\/ol>\n<p><b>Inhaltsverzeichnis:<\/b><\/p>\n<ol>\n<li style=\"list-style-type: none\">\n<ol>\n<li style=\"font-weight: 400\"><a href=\"\/#definition\">Definitionen von Transfer Learning<\/a><\/li>\n<li style=\"font-weight: 400\"><a href=\"\/#techniken\">Auf welchen Strategien beruhen die Techniken des Transfer Learning?<\/a><\/li>\n<li style=\"font-weight: 400\"><a href=\"\/#problemen\">Wie wird Transfer Learning bei der L\u00f6sung von Problemen eingesetzt?<\/a><\/li>\n<li style=\"font-weight: 400\"><a href=\"\/#schlusselpunkte\">Schl\u00fcsselpunkte, an die Sie sich erinnern sollten<\/a><\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<p>Andrew Ng, leitender Wissenschaftler bei <i>Baidu <\/i>und Professor in <i>Stanford, <\/i>hat in seinem beliebten <i>NIPS-Tutorial 2016 <\/i>erkl\u00e4rt, dass Transfer Learning der n\u00e4chste Motor f\u00fcr den kommerziellen Erfolg von Machine Learning sein wird. Und er ist nicht der Einzige, der das Potenzial von <b><i>Transfer Learning <\/i><\/b>lobt <b>&#8230; <\/b>In diesem Artikel erz\u00e4hlen wir dir alles \u00fcber <b>diesen Begriff, der immer mehr in aller Munde ist. <\/b>Liora hilft dir dabei, drei <b>grundlegende <\/b>Fragen zu beantworten:&nbsp;<\/p>\n<ul>\n<li style=\"font-weight: 400\">Was ist Transfer Learning?<\/li>\n<li style=\"font-weight: 400\">Auf welchen Strategien beruhen die Techniken des <i>Transfer Learning?<\/i><\/li>\n<li style=\"font-weight: 400\">Wie werden sie konkret zur L\u00f6sung von <i>Deep-Learning-Problemen eingesetzt<\/i>?<\/li>\n<\/ul>\n<h3>Transfer Learning: Definition<\/h3>\n<p>Beginnen wir zun\u00e4chst mit einer Definition dieses Begriffs, der in der <i>Data Science immer <\/i>h\u00e4ufiger verwendet wird.<\/p>\n<blockquote><p><i>Transfer Learning <\/i>bezeichnet alle Methoden, die es erm\u00f6glichen, das aus der L\u00f6sung eines bestimmten Problems gewonnene Wissen auf die Bearbeitung eines anderen Problems zu \u00fcbertragen.&nbsp;<\/p><\/blockquote>\n<p><i>Transfer Learning <\/i>hat mit dem Aufschwung des <i>Deep Learning einen <\/i>gro\u00dfen Erfolg erlebt.&nbsp; Die in diesem Bereich verwendeten Modelle erfordern oft <b>hohe Rechenzeiten <\/b>und einen <b>gro\u00dfen Ressourcenbedarf. <\/b>Durch die Verwendung von vortrainierten Modellen als Ausgangspunkt erm\u00f6glicht <i>Transfer Learning die <\/i>schnelle Entwicklung von leistungsf\u00e4higen Modellen und die effiziente L\u00f6sung komplexer Probleme im Bereich <i>Computer Vision <\/i>oder <i>Natural Language Processing<\/i>, <i>NLP<\/i>.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"237\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.28.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 1 &#8211; Traditioneller Ansatz vs. Transfer Learning-Ansatz<\/figcaption><\/figure>\n<p>Intuitiv orientiert sich <i>Transfer Learning <\/i>stark an dem Prozess, mit dem wir lernen.&nbsp;<\/p>\n<blockquote><p>Nehmen wir zum Beispiel jemanden, der das Gitarrenspiel beherrscht und Klavierspielen lernen m\u00f6chte. Er kann seine Musikkenntnisse nutzen, um ein neues Instrument zu erlernen. In \u00e4hnlicher Weise kann ein Modell zur Erkennung von Autos sehr schnell auf die Erkennung von Lastwagen umgestellt werden.<\/p><\/blockquote>\n<h3>Auf welchen Strategien beruhen die Techniken des Transfer Learning?<\/h3>\n<p><i>Transfer Learning beruht <\/i>auf der einfachen Idee, das in anderen Konstellationen erworbene Wissen (Quellen) zur L\u00f6sung eines bestimmten Problems (Ziel) erneut zu nutzen. In diesem Zusammenhang lassen sich verschiedene Ans\u00e4tze unterscheiden, je nachdem, was man \u00fcbertragen m\u00f6chte, wann und wie man den Transfer durchf\u00fchrt. Insgesamt k\u00f6nnen wir <b>drei Arten von <\/b><b><i>Transfer Learning <\/i><\/b>unterscheiden:<\/p>\n<p style=\"padding-left: 40px\"><strong><b><i>1. Inductive Transfer Learning<\/i><\/b><b>, oder <\/b><b><i>induktives Transferlernen<\/i><\/b><\/strong><\/p>\n<p>In dieser Konfiguration sind die Quell- und Zieldom\u00e4nen gleich (dieselben Daten), aber die Quell- und Zielaufgaben sind unterschiedlich, aber nahe beieinander. Die Idee besteht nun darin, <b>bestehende Modelle zu nutzen, <\/b>um <b>den Anwendungsbereich m\u00f6glicher Modelle vorteilhaft einzuschr\u00e4nken <\/b>(Modellverzerrung), wie in der folgenden Abbildung dargestellt.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"359\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.33.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 2 &#8211; Illustration von Inductive Transfer Learning (induktives Transferlernen)<\/figcaption><\/figure>\n<p>Beispielsweise ist es m\u00f6glich, ein Modell, das auf die Erkennung von Tieren auf Bildern trainiert wurde, zu verwenden, um ein Modell zu erstellen, das Hunde identifizieren kann.&nbsp;&nbsp;&nbsp;<\/p>\n<p style=\"padding-left: 40px\"><b><i>2. Unsupervised Transfer Learning<\/i><\/b><b>, oder un\u00fcberwachtes <\/b><b><i>Transferlernen<\/i><\/b><\/p>\n<p>Wie beim induktiven Transferlernen sind die Quell- und Zieldom\u00e4nen \u00e4hnlich, die Aufgaben sind jedoch unterschiedlich. Allerdings werden die Daten der beiden Dom\u00e4nen nicht mit einem Label versehen.<\/p>\n<p>Es ist oft einfacher, gro\u00dfe Mengen an ungelabelten Daten, z. B. aus Datenbanken und Quellen im Internet, zu erhalten als gelabelte Daten. Daher besteht <b>gro\u00dfes Interesse <\/b>an der Idee, <b>un\u00fcberwachtes Lernen in Kombination mit <\/b><b><i>Transfer Learning einzusetzen<\/i><\/b>.&nbsp;<\/p>\n<p>Als Beispiel sei das <i>Self-taught clustering genannt<\/i>, ein Ansatz, bei dem kleine Sammlungen von nicht gelabelten Zieldaten mit Hilfe einer gro\u00dfen Menge nicht gelabelter Quelldaten <i>geclustert werden. <\/i>Dieser Ansatz erweist sich als <b>leistungsf\u00e4higer <\/b>als die traditionell verwendeten Spitzenans\u00e4tze, wenn die Zieldaten irrelevant gelabelt sind.<\/p>\n<p style=\"padding-left: 40px\"><b><i>3. Transduktives Transfer<\/i><\/b><b>lernen, oder <\/b><b><i>Transductive Transfer Learning <\/i><\/b><b>:<\/b><\/p>\n<p>In dieser Konfiguration sind die Quell- und Zielaufgaben \u00e4hnlich, aber die entsprechenden Bereiche unterscheiden sich entweder in Bezug auf die Daten oder die Verteilungen der Randwahrscheinlichkeiten.&nbsp;<\/p>\n<p>Zum Beispiel werden <i>NLP-Modelle<\/i>, wie sie f\u00fcr die morpho-syntaktische Kennzeichnung von W\u00f6rtern, Part-Of-Speech Tagger (POS Tagger) auf Englisch, verwendet werden, normalerweise mit Nachrichtendaten wie denen des <i>Wall Street Journal <\/i>trainiert und getestet. Sie k\u00f6nnen an Daten aus sozialen Netzwerken angepasst werden, deren Inhalt anders, aber \u00e4hnlich wie der Zeitungen ist.<\/p>\n<h3>Wie wird Transfer Learning konkret zur L\u00f6sung von Deep-Learning-Problemen eingesetzt?<\/h3>\n<p>Nachdem wir <b><i>Transfer Learning <\/i><\/b>definiert haben, wollen wir uns nun mit seiner <b>Anwendung auf Probleme des Deep <\/b><b><i>Learning <\/i><\/b>besch\u00e4ftigen, einem Bereich, in dem <b><i>Transfer <\/i><\/b><b>Learning <\/b>heute sehr erfolgreich ist.<\/p>\n<p>Die Verwendung von <i>Transfer Learning-Methoden <\/i>im <i>Deep Learning <\/i>besteht haupts\u00e4chlich darin, vorab trainierte neuronale Netze zu nutzen<\/p>\n<p>In der Regel entsprechen diese Modelle sehr leistungsf\u00e4higen Algorithmen, die anhand gro\u00dfer Datenbanken entwickelt und trainiert wurden und heute frei geteilt werden.<\/p>\n<p>In diesem Zusammenhang k\u00f6nnen 2 Arten von Strategien unterschieden werden:<\/p>\n<p style=\"padding-left: 40px\"><b>1. Verwendung von vorab trainierten Modellen als <\/b><b><i>Feature-Extraktoren <\/i><\/b><b>:<\/b><\/p>\n<p>Die Architektur von <i>Deep-Learning-Modellen wird <\/i>sehr h\u00e4ufig in Form eines <b>Stapels von Neuronenschichten dargestellt<\/b>. Diese Schichten lernen verschiedene Merkmale, je nachdem, auf welcher Ebene sie sich befinden. Die letzte Schicht (im Falle des \u00fcberwachten Lernens normalerweise eine vollst\u00e4ndig verbundene Schicht) wird verwendet, um die endg\u00fcltige Ausgabe zu erhalten. Die folgende Abbildung zeigt die Architektur eines <i>Deep-Learning-Modells, das <\/i>f\u00fcr die Erkennung von Katzen\/Hunden verwendet wird. <b>Je tiefer die Schicht liegt, desto mehr spezifische <\/b><b><i>Features <\/i><\/b><b>k\u00f6nnen extrahiert werden<\/b>.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"304\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.40.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 3 &#8211; Beispiel f\u00fcr ein Modell eines neuronalen Netzes, das zur Bildklassifizierung verwendet wird<\/figcaption><\/figure>\n<p>Die Idee ist also, ein vorab trainiertes Netzwerk ohne seine Endschicht wiederzuverwenden. Dieses neue Netzwerk fungiert dann als Extraktor von fixen <i>Features, <\/i>um andere Aufgaben zu erledigen.<\/p>\n<p>Um diese Strategie zu veranschaulichen, nehmen wir den Fall an, dass wir <strong>ein Modell erstellen<\/strong> wollen, das <strong>die Art einer Blume anhand ihres Bildes identifizieren kann<\/strong>. Dann ist es m\u00f6glich, die ersten Schichten des Modells eines faltenden neuronalen Netzes zu verwenden <a href=\"https:\/\/en.wikipedia.org\/wiki\/AlexNet\">AlexNet<\/a>, das urspr\u00fcnglich auf die Bilddatenbank trainiert wurde. <a href=\"https:\/\/en.wikipedia.org\/wiki\/ImageNet#ImageNet_Challenge\">ImageNet<\/a> f\u00fcr die Bildklassifizierung verwendet werden.<\/p>\n<p>Auch wenn die Idee einfach erscheint, k\u00f6nnte man sich fragen, wie leistungsf\u00e4hig ein solcher Ansatz ist. In der Praxis funktioniert er sehr gut, wie die folgende Abbildung zeigt.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"339\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.46.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 4 &#8211; Leistung von Deep-Learning-Modellen, die speziell auf die Aufgabe trainiert wurden (gr\u00fcn), im Vergleich zu vortrainierten Modellen (rot, rosa)<\/figcaption><\/figure>\n<p style=\"padding-left: 40px\"><b>2. Anpassen von vortrainierten Modellen :<\/b><\/p>\n<p>&nbsp;Dies ist eine <b>komplexere Technik<\/b>, bei der nicht nur die letzte Schicht ersetzt wird, um die Klassifizierung oder Regression durchzuf\u00fchren, sondern auch andere Schichten selektiv neu trainiert werden. <b>Tiefe neuronale Netze sind n\u00e4mlich hochgradig konfigurierbare Architekturen <\/b>mit verschiedenen Hyperparametern. Au\u00dferdem erfassen die ersten Schichten generische Merkmale, w\u00e4hrend die letzten Schichten sich mehr auf die spezifische Aufgabe konzentrieren, die es zu erf\u00fcllen gilt, wie die folgende Abbildung zeigt<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"405\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.52.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 5 &#8211; Beispiel f\u00fcr ein Modell eines neuronalen Netzes, das f\u00fcr die Gesichtserkennung verwendet wird<\/figcaption><\/figure>\n<p>Die Idee ist also, w\u00e4hrend des Trainings bestimmte Schichten einzufrieren (d. h. die Gewichte zu fixieren) und den Rest zu verfeinern, um das Problem zu l\u00f6sen.&nbsp;<\/p>\n<p>Diese Strategie erm\u00f6glicht es, das Wissen \u00fcber die Gesamtarchitektur des Netzwerks wiederzuverwenden und seine Zust\u00e4nde als Ausgangspunkt f\u00fcr das Training zu nutzen. <b>Sie f\u00fchrt daher zu einer besseren Leistung bei k\u00fcrzerer Trainingszeit.<\/b><\/p>\n<p>Die folgende Abbildung fasst die wichtigsten <i>Transfer Learning-Ans\u00e4tze <\/i>zusammen, die gemeinhin im <i>Deep Learning <\/i>verwendet werden<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"481\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Capture-de\u0301cran-2020-07-21-a\u0300-08.45.58.webp\" alt=\"\" loading=\"lazy\"><figcaption>Abbildung 6 &#8211; Transfer Learning-Ansatz in Deep Learning<\/figcaption><\/figure>\n<p>Eine der <b>grundlegenden Anforderungen an das <\/b>Transfer Learning <b>ist das Vorhandensein von Modellen, <\/b>die auf den Quellaufgaben gut funktionieren. Gl\u00fccklicherweise werden heute viele der f\u00fchrenden Deep-Learning-Architekturen von ihren jeweiligen Teams frei geteilt. Diese erstrecken sich \u00fcber verschiedene Bereiche wie Computer Vision oder Computer Vision und Natural Language Processing oder NLP, zwei sehr beliebte Bereiche des Deep Learning.<\/p>\n<p>Zu den sehr h\u00e4ufig verwendeten Vorlagen geh\u00f6ren :<\/p>\n<ul>\n<li style=\"font-weight: 400\">Computer Vision: <a href=\"https:\/\/www.kaggle.com\/keras\/vgg19\/home\">VGG-16<\/a>, <a href=\"https:\/\/www.kaggle.com\/keras\/vgg19\/home\">VGG-19<\/a>, <a href=\"https:\/\/www.kaggle.com\/keras\/resnet50\">ResNet-50<\/a><\/li>\n<li style=\"font-weight: 400\">NLP: <a href=\"https:\/\/en.wikipedia.org\/wiki\/Word2vec\">Word2Vec, <\/a><a href=\"https:\/\/nlp.stanford.edu\/projects\/glove\/\">GloVe<\/a><\/li>\n<\/ul>\n<h3>Schl\u00fcsselpunkte, an die du dich erinnern solltest<\/h3>\n<p><i>Transfer Learning <\/i>entspricht der F\u00e4higkeit, vorhandenes Wissen, das zur L\u00f6sung gegebener Probleme entwickelt wurde, zur L\u00f6sung eines neuen Problems zu nutzen. Wir haben uns mit verschiedenen Ans\u00e4tzen des <i>Transfer Learning <\/i>befasst. Um die am besten geeignete Strategie ausw\u00e4hlen zu k\u00f6nnen, ist es wichtig, die folgenden drei Fragen zu untersuchen:&nbsp;<\/p>\n<ol>\n<li style=\"font-weight: 400\">\n<ol>\n<li style=\"font-weight: 400\"><b>Was wollen wir \u00fcbertragen?<\/b> Dies ist die erste und wichtigste Frage, die man sich stellen muss. Mit ihr soll festgelegt werden, welcher Teil des Wissens von der Quelle auf das Ziel \u00fcbertragen werden soll, um die Problematik der Zielaufgabe zu l\u00f6sen.&nbsp;<\/li>\n<li style=\"font-weight: 400\"><b>Wann will man transferieren? <\/b>Es kann Szenarien geben, in denen die Anwendung von <i>Transfer-Learning-Methoden <\/i>zu einer Verschlechterung der Ergebnisse f\u00fchrt. In Wirklichkeit h\u00e4ngen diese Leistungen von der \u00c4hnlichkeit der Ziel- und Quelldom\u00e4nen und -aufgaben ab.<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<p><b>Wie soll das Transfer Leaning durchgef\u00fchrt werden? <\/b>Wenn wir die Fragen &#8222;Was&#8220; und &#8222;Wann&#8220; beantwortet haben, k\u00f6nnen wir damit beginnen, die <i>Transfer-Leaning-Technik zu <\/i>identifizieren, die f\u00fcr das Problem, das wir l\u00f6sen wollen, am besten geeignet ist.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In diesem f\u00fcnften und letzten Teil unserer Serie \u00fcber Deep Learning erf\u00e4hrst du mehr \u00fcber die Definition und die Funktionsweise von Transfer Learning. Wenn du auf die ersten Artikel zur\u00fcckgreifen m\u00f6chtest, findest du hier eine Liste : Einf\u00fchrung in Deep Learning Neuronale Netzwerke: biologisch oder k\u00fcnstlich &nbsp;Convolutional Neural Network &nbsp;Funktionsweise von Netzen neuronalen&nbsp; Transfer Learning [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":165031,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-165029","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165029","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=165029"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165029\/revisions"}],"predecessor-version":[{"id":217736,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165029\/revisions\/217736"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/165031"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=165029"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=165029"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}