{"id":189137,"date":"2023-11-24T17:54:48","date_gmt":"2023-11-24T16:54:48","guid":{"rendered":"https:\/\/liora.io\/de\/?p=189137"},"modified":"2026-02-06T06:08:05","modified_gmt":"2026-02-06T05:08:05","slug":"self-supervised-learning-was-ist-das-eigentlich","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/self-supervised-learning-was-ist-das-eigentlich","title":{"rendered":"Self Supervised Learning: Was ist das eigentlich?"},"content":{"rendered":"<h2>In seinem im M\u00e4rz 2021 ver\u00f6ffentlichten Forschungsartikel beschreibt Yann LeCun, Vizepr\u00e4sident und leitender Wissenschaftler f\u00fcr k\u00fcnstliche Intelligenz bei Facebook, selbstgesteuertes Lernen als &#8222;eine der vielversprechendsten M\u00f6glichkeiten, Maschinen mit Grundwissen oder &#8218;gesundem Menschenverstand&#8216; zu bauen, um Aufgaben anzugehen, die weit \u00fcber die F\u00e4higkeiten der heutigen KI hinausgehen&#8220;.<\/h2>\t\t\n\t\t<p>Diese Methode, die als &#8222;<strong>dunkle Materie der Intelligenz<\/strong>&#8220; bezeichnet wird, etikettiert Daten automatisch. Daher scheint sie in einer Zeit, in der es teuer ist, gekennzeichnete Daten zu haben, sehr vielversprechend zu sein.<\/p>\t\t\n\t\t\t<h3>Wie funktioniert Self Supervised Learning?<\/h3>\t\t\n\t\t<p><strong>Selbst\u00fcberwachtes Lernen<\/strong> basiert auf einem k\u00fcnstlichen neuronalen Netz und kann als <a href=\"https:\/\/liora.io\/de\/supervised-learning-5-wichtige-punkte\">Mittelweg zwischen \u00fcberwachtem und un\u00fcberwachtem Lernen<\/a> angesehen werden. Es hat den gro\u00dfen Vorteil, dass es ungelabelte Daten verarbeitet und die zugeh\u00f6rigen Labels automatisch und <a href=\"https:\/\/liora.io\/de\/ki-trainieren-ohne-daten-mit-dieser-neuen-technik-ist-es-moeglich\">ohne menschliches Zutun generiert.<\/a> Diese Methode funktioniert, indem ein Teil der Lerndaten verborgen wird und das Modell trainiert wird, diese verborgenen Daten zu identifizieren.<\/p><p>Diese Identifizierung erfolgt durch die <strong>Analyse der Struktur und der Merkmale der Daten,<\/strong> die nicht ausgeblendet wurden. Diese gelabelten Daten werden dann f\u00fcr den Schritt des \u00fcberwachten Lernens verwendet.<\/p>\t\t\n\t\t\t<h3>Was sind ihre Unterschiede zum beaufsichtigten und unbeaufsichtigten Lernen und ihre Vorteile?<\/h3>\t\t\n\t\t<p><strong>\u00dcberwachte Lernmethoden<\/strong> haben vordefinierte Labels. H\u00e4ufig wurden diese Labels durch menschliches Eingreifen vergeben.<\/p><p>Diese Arbeit ist jedoch oft sehr zeitaufwendig und kostspielig, weshalb gelabelte Daten selten sind. Au\u00dferdem ben\u00f6tigen maschinelle Lernalgorithmen oft eine gro\u00dfe Menge an Daten, um genaue Ergebnisse zu liefern.<\/p><p><a href=\"https:\/\/liora.io\/de\/clean-das-revolutionaere-neue-data-tool-fuer-die-medizin\">In manchen Bereichen, wie z. B. der Medizin,<\/a> erfordert diese Etikettierungsarbeit spezielle Kenntnisse, was die Aufgabe noch komplexer macht. Das Self Supervised Learning bietet eine Alternative zu dieser \u00fcberfl\u00fcssigen Arbeit und steht damit an der Spitze des Feldes.<\/p>\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/10\/apprantissage-auto-supervise.png\" title=\"\" alt=\"\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t<figcaption><\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/weiterbildung-data-scientist\">Alles \u00fcber selbstgesteuertes Lernen lernen<\/a><\/div><\/div>\n\n\t\t<p>Es gibt auch andere Methoden, um das Problem der<strong> Datenbeschriftung<\/strong> zu umgehen, insbesondere das halb\u00fcberwachte Lernen, das haupts\u00e4chlich mit nicht beschrifteten Daten arbeitet, zu denen ein kleiner Teil beschrifteter Daten hinzukommt.<\/p><p><strong>Self Supervised Learning <\/strong>kann als eine Unterkategorie des un\u00fcberwachten Lernens angesehen werden, da beide Ans\u00e4tze mit nicht gekennzeichneten Datens\u00e4tzen arbeiten.<\/p><p>Allerdings unterscheidet sich das un\u00fcberwachte Lernen in seinem Ziel, es konzentriert sich ausschlie\u00dflich auf die Gruppierung der Daten und die Reduzierung der Dimensionen. Im Gegensatz dazu ist das Endziel des selbst\u00fcberwachten Lernens die Vorhersage einer klassifizierten Ausgabe.<\/p><p>Ein weiterer Vorteil des<strong> Self Supervised Learning<\/strong> liegt in einem tieferen Verst\u00e4ndnis der Daten und der Muster und Strukturen, aus denen sie bestehen. Die gelernten Darstellungen lassen sich dadurch leicht verallgemeinern.<\/p>\t\t\n\t\t\t<h3>Selbst\u00fcberwachtes Lernen in der nat\u00fcrlichen Sprachverarbeitung<\/h3>\t\t\n\t\t<p>Beim <a href=\"https:\/\/liora.io\/de\/nlp-natural-language-processing-eine-einfuhrung\">Natural Language Processing (NLP) wird selbstgesteuertes Lernen verwendet,<\/a> indem das Modell mit S\u00e4tzen trainiert wird, aus denen zuf\u00e4llig W\u00f6rter entfernt wurden. Das Modell muss dann die entfernten W\u00f6rter vorhersagen. Diese Methode hat sich bei der Anwendung auf NLP als effektiv und sehr relevant erwiesen.<\/p><p><a href=\"https:\/\/liora.io\/de\/bert\">Die Modelle wav2vec und BERT,<\/a> die von Facebook bzw. Google AI entwickelt wurden, geh\u00f6ren beispielsweise zu den revolution\u00e4rsten NLP-Modellen. Wav2vec hat sich im Bereich der Spracherkennung oder <strong>Automatic Speech Recognition (ASR)<\/strong> bew\u00e4hrt.<\/p><p>Dabei werden bestimmte Teile des Audios ausgeblendet und das Modell wird darauf trainiert, diese Teile vorherzusagen. BERT, ein Akronym f\u00fcr Bidirectional Encoder Representations from Transformers, ist ein Deep-Learning-Modell, das derzeit die besten Ergebnisse f\u00fcr die meisten NLP-Aufgaben liefert.<\/p><p>Im Gegensatz zu den vor ihm etablierten Modellen, die den Text eindimensional durchlaufen, um das n\u00e4chste Wort vorherzusagen, versteckt der BERT-Algorithmus zuf\u00e4llig W\u00f6rter im Satz und versucht, sie vorherzusagen. Dazu nutzt er den kompletten Kontext des Satzes, links und rechts.<\/p>\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/10\/apprentissage-auto-supervise-nlp.jpg\" title=\"\" alt=\"\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t<figcaption><\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"\/formation\/data-ia\/data-scientist\">Das selbstgesteuerte Lernen beherrschen<\/a><\/div><\/div>\n\n\t\t\t<h3>Von NLP zu Computer Vision<\/h3>\t\t\n\t\t<p>Nachdem es sich in der <strong>nat\u00fcrlichen Sprachverarbeitung<\/strong> bew\u00e4hrt hat, hat sich das selbst\u00fcberwachte Lernen auch in der Computer Vision durchgesetzt. Facebook AI hat ein neues Modell vorgestellt, das auf selbst\u00fcberwachtem Lernen basiert und auf Computer Vision angewendet wird, das SEER (f\u00fcr SElf-supERvised) genannt wird. Es wurde mit einer Milliarde nicht gekennzeichneter Bilder aus Instagram trainiert. Das Modell erreichte eine Rekordgenauigkeit von 84,2 % in der ImageNet-Bilddatenbank.<\/p><p>In der Computer Vision war das selbst\u00fcberwachende Lernen auch weitgehend n\u00fctzlich f\u00fcr das Einf\u00e4rben von Bildern, die 3D-Rotation und das Ausf\u00fcllen von Kontexten.<\/p>\t\t\n\t\t\t<h3>Wo liegen die Grenzen des selbstgesteuerten Lernens\/ Self Supervised Learning?<\/h3>\t\t\n\t\t<p>Die Modellbildung kann rechenintensiver sein. Da das <strong>selbst\u00fcberwachende Lernen<\/strong> die den Daten zugeordneten Labels selbstst\u00e4ndig generiert, wird im Vergleich zu einem Lernmodell mit Labels zus\u00e4tzliche Rechenzeit ben\u00f6tigt.<\/p><p>Das <strong>selbstgesteuerte Lernen<\/strong> ist n\u00fctzlich, wenn wir einen Satz nicht gekennzeichneter Daten haben und diese manuell zuordnen m\u00fcssen. Diese Methode kann jedoch Fehler bei der Beschriftung verursachen, die zu ungenauen Ergebnissen f\u00fchren.<\/p>\t\t\n\t\t\t<h3>Fazit zum Self Supervised Learning<\/h3>\t\t\n\t\t<p><strong>Self Supervised Learning<\/strong> ist ein weiterer Schritt auf dem Weg zu einer <a href=\"https:\/\/liora.io\/de\/trojannet-revolution-bei-angriffen-auf-modelle-kuenstlicher-intelligenz\">k\u00fcnstlichen Intelligenz<\/a> mit &#8222;gesundem Menschenverstand&#8220;. Durch die Arbeit mit ungetaggten Daten l\u00f6st diese Methode die langwierige und m\u00fchsame Aufgabe, Daten zu taggen. Sie er\u00f6ffnet revolution\u00e4re neue Ans\u00e4tze in vielen Bereichen der k\u00fcnstlichen Intelligenz, wie<a href=\"https:\/\/liora.io\/de\/nlp-language-translation-alles-was-du-wissen-musst\"> NLP oder Computer Vision.<\/a><\/p><p>Wenn du mehr \u00fcber <strong>Machine Learning<\/strong> und Deep Learning Algorithmen erfahren m\u00f6chtest, kannst du dir unser Angebot an Schulungen f\u00fcr Datenberufe ansehen.<\/p>\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t<figure>\n\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/2023\/10\/apprentissage-auto-supervise-2.jpg\" title=\"\" alt=\"\" loading=\"lazy\">\t\t\t\t\t\t\t\t\t\t\t<figcaption><\/figcaption>\n\t\t\t\t\t\t\t\t\t\t<\/figure>\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"\/formation\/data-ia\/data-scientist\">Sich im selbstgesteuerten Lernen schulen lassen<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>In seinem im M\u00e4rz 2021 ver\u00f6ffentlichten Forschungsartikel beschreibt Yann LeCun, Vizepr\u00e4sident und leitender Wissenschaftler f\u00fcr k\u00fcnstliche Intelligenz bei Facebook, selbstgesteuertes Lernen als &#8222;eine der vielversprechendsten M\u00f6glichkeiten, Maschinen mit Grundwissen oder &#8218;gesundem Menschenverstand&#8216; zu bauen, um Aufgaben anzugehen, die weit \u00fcber die F\u00e4higkeiten der heutigen KI hinausgehen&#8220;. Diese Methode, die als &#8222;dunkle Materie der Intelligenz&#8220; bezeichnet [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":189139,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-189137","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/189137","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=189137"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/189137\/revisions"}],"predecessor-version":[{"id":217062,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/189137\/revisions\/217062"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/189139"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=189137"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=189137"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}