{"id":165495,"date":"2026-01-28T03:50:16","date_gmt":"2026-01-28T02:50:16","guid":{"rendered":"https:\/\/liora.io\/de\/?p=165495"},"modified":"2026-02-20T08:53:48","modified_gmt":"2026-02-20T07:53:48","slug":"t-sne-algorithmus","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/t-sne-algorithmus","title":{"rendered":"Den t-SNE-Algorithmus in 3 Schritten verstehen"},"content":{"rendered":"\n<p><strong>Wenn du dich schon einmal f\u00fcr Methoden zur Dimensionsreduktion interessiert hast, hast du dich wahrscheinlich mit der Hauptkomponentenanalyse oder PCA besch\u00e4ftigt. In diesem Artikel werden wir uns mit einer der anderen Methoden zur Dimensionsreduktion besch\u00e4ftigen, die es gibt: t-SNE f\u00fcr t-distributed Stochastic Neighbor Embedding (t-distributed Stochastic Neighbor Embedding). Dieser Algorithmus bietet einen anderen Ansatz als die PCA.<\/strong><\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>t-SNE ist eine Technik zur Dimensionsreduktion, die bei der Erforschung gro\u00dfer Datenmengen eingesetzt wird. Sie wurde 2008 von <a href=\"https:\/\/de.wikipedia.org\/wiki\/Geoffrey_Hinton\">Geoffrey Hinton<\/a> und Laurens van der Maaten entwickelt. Wie bei der PCA besteht das Ziel darin, <strong>einen Raum mit kleinerer Dimension zu bestimmen, w\u00e4hrend die Abst\u00e4nde <\/strong>zwischen den Punkten <strong>erhalten bleiben<\/strong>.<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-was-ist-der-unterschied-zwischen-t-sne-und-pca\">Was ist der Unterschied zwischen t-SNE und PCA?<\/h2>\n\n\n\n<p><a href=\"https:\/\/liora.io\/acp\">Die Hauptkomponentenanalyse<\/a> ist eine weit verbreitete Methode zur Dimensionsreduktion, bei der versucht wird, die Daten in einer nahen Hyperebene so darzustellen, dass die <strong>Varianz der Datenwolke<\/strong> maximal erhalten bleibt. Mit anderen Worten: Die Daten werden in einem kleineren Unterraum dargestellt, der die gesamte Tr\u00e4gheit der Wolke, die in diesen Raum projiziert wird, maximiert. Wenn du mehr \u00fcber die <strong>PCA <\/strong>wissen willst, schau dir unser Video dazu an:<\/p>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Data Insights : Analyse en Composantes Principales\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/ilWeGsudOGY?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\">Klicken Sie hier, um mehr \u00fcber unsere Schulungen zu erfahren<\/a><\/div>\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-was-ist-das-t-sne-prinzip\">Was ist das t-SNE-Prinzip?<\/h2>\n\n\n\n<p>Der t-SNE-Algorithmus besteht darin, eine Wahrscheinlichkeitsverteilung zu erstellen, die die \u00c4hnlichkeiten zwischen Nachbarn in einem hochdimensionalen Raum und in einem kleineren Raum darstellt. Mit \u00c4hnlichkeit wollen wir versuchen, Entfernungen in Wahrscheinlichkeiten umzuwandeln. <b>Sie besteht aus drei Schritten:<\/b><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Schritt 1: <\/b>Wir berechnen die \u00c4hnlichkeiten der Punkte im gro\u00dfdimensionalen Ausgangsraum. F\u00fcr jeden Punkt xi zentrieren wir eine Gau\u00dfsche Verteilung um diesen Punkt herum. Dann messen wir f\u00fcr jeden Punkt xj (i verschieden von j) die Dichte unter dieser zuvor definierten Gau\u00dfverteilung. Schlie\u00dflich normalisieren wir f\u00fcr jeden Punkt. Wir erhalten eine Liste von bedingten Wahrscheinlichkeiten, die mit :<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image aligncenter is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/image2.webp\" alt=\"\" style=\"width:auto;height:75px\" \/><\/figure>\n\n\n\n<p>Die Standardabweichung wird anhand eines Wertes definiert, der <b>Perplexit\u00e4t <\/b>genannt wird und der Anzahl der Nachbarn um jeden Punkt entspricht. Dieser Wert wird vom User vorab festgelegt und dient dazu, die Standardabweichung der Gau\u00dfschen Verteilungen zu sch\u00e4tzen, die f\u00fcr jeden Punkt xi definiert sind. Je gr\u00f6\u00dfer die Perplexit\u00e4t, desto gr\u00f6\u00dfer ist die Varianz.&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Schritt 2: <\/b>Wir m\u00fcssen einen kleineren Raum erstellen, in dem wir unsere Daten darstellen. Nat\u00fcrlich kennen wir zu Beginn nicht die idealen Koordinaten auf diesem Raum. Daher werden wir die Punkte zuf\u00e4llig auf diesem neuen Raum verteilen. Der Rest ist ziemlich \u00e4hnlich wie in Schritt 1. Wir berechnen die \u00c4hnlichkeiten der Punkte in dem neu erstellten Raum, allerdings unter Verwendung einer <b>t-Student-Verteilung und nicht einer <\/b>Gau\u00dfschen Verteilung. Auf die gleiche Weise erhalten wir eine Liste von Wahrscheinlichkeiten, die mit :<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image aligncenter is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/image1.webp\" alt=\"\" style=\"width:auto;height:100px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Schritt 3: <\/b>Um die Punkte im kleineren Raum genau darzustellen, m\u00f6chten wir im Idealfall, dass die \u00c4hnlichkeitsma\u00dfe in den beiden R\u00e4umen \u00fcbereinstimmen. Daher m\u00fcssen wir die \u00c4hnlichkeiten der Punkte in den beiden R\u00e4umen mithilfe des Ma\u00dfes <b>Kullback_Leibler (KL) <\/b>vergleichen. Wir versuchen dann, es durch Gradientenabstieg zu minimieren, um die bestm\u00f6glichen yi im kleinr\u00e4umigen Raum zu erhalten. Dies ist gleichbedeutend mit der Minimierung der Abweichung der Wahrscheinlichkeitsverteilungen zwischen dem urspr\u00fcnglichen Raum und dem Raum mit der kleinsten Dimension.&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\">Entdecken Sie unsere Kurse in Data Science<\/a><\/div>\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-wie-unterscheiden-sich-die-methoden-acp-und-t-sne\">Wie unterscheiden sich die Methoden ACP und t-SNE?<\/h2>\n\n\n\n<p>Um die Unterschiede zwischen den beiden Methoden <b>PCA und t-SNE <\/b>besser zu verstehen, betrachten wir den <b>MNIST-Datensatz<\/b>. F\u00fcr jede der beiden Methoden haben wir die Daten in <b>einem zweidimensionalen Raum <\/b>dargestellt.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/image3.webp\" alt=\"\" \/><figcaption class=\"wp-element-caption\">Dimensionsreduktion mit der TSNE-Methode<\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image aligncenter\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/image4.webp\" alt=\"\" \/><figcaption class=\"wp-element-caption\">Dimensionsreduktion mit einer PCA<\/figcaption><\/figure>\n\n\n\n<p>In der ersten Abbildung sehen wir das Ergebnis einer Dimensionsreduktion mit der <b>t-SNE-Methode<\/b>. In der zweiten Abbildung sehen wir das Ergebnis einer <b>Hauptkomponentenanalyse<\/b>.&nbsp;<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Es ist klar, dass TSNE es geschafft hat, <b>nahe beieinander liegende Daten zu gruppieren <\/b>und un\u00e4hnliche Daten voneinander zu entfernen. Die Punkte werden in Clustern dargestellt, wobei jeder Cluster einer Zahl zwischen 1 und 6 entspricht.&nbsp;<\/p>\n<\/blockquote>\n\n\n\n<p>Bei den Ergebnissen der <b>PCA <\/b>ist die <b>Trennung der Daten <\/b>im zweidimensionalen Raum <b>viel weniger deutlich<\/b>. Wir k\u00f6nnen sehen, dass bei einigen Zahlen wie 0 die entsprechenden Punkte gut gruppiert sind. Bei anderen Zahlen, wie z. B. 5, sind die Punkte jedoch <b>diffuser verteilt<\/b>. &nbsp;<\/p>\n\n\n\n<p>Wenn du dich \u00fcber Themen wie Verkleinerungstechniken weiterbilden m\u00f6chtest, dann besuche <a href=\"\/formation\/data-ia\/\">unsere Kurse im Bootcamp- oder im fortlaufenden Format!<\/a><\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\/data-ki\">Erfahren Sie mehr \u00fcber unsere Schulungen<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Was ist der Unterschied zwischen t-SNE und PCA?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Die Hauptkomponentenanalyse (PCA) ist eine Methode zur Dimensionsreduktion, die Daten in einer nahen Hyperebene so darstellt, dass die Varianz der Datenwolke maximal erhalten bleibt. t-SNE (t-distributed Stochastic Neighbor Embedding) verfolgt einen anderen Ansatz, der 2008 von Geoffrey Hinton und Laurens van der Maaten entwickelt wurde und besonders bei der Erforschung gro\u00dfer Datenmengen eingesetzt wird.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Was ist das t-SNE-Prinzip?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"t-SNE arbeitet in drei Schritten: 1. Berechnung der \u00c4hnlichkeiten im hochdimensionalen Raum durch Gau\u00dfsche Verteilungen um jeden Punkt (gesteuert durch den Perplexit\u00e4ts-Parameter). 2. Zuf\u00e4llige Verteilung der Punkte im niedrigdimensionalen Raum und Berechnung der \u00c4hnlichkeiten mit t-Student-Verteilung. 3. Minimierung der Abweichung zwischen beiden Wahrscheinlichkeitsverteilungen mittels Kullback-Leibler-Divergenz und Gradientenabstieg, um die optimalen Positionen im niedrigdimensionalen Raum zu finden.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Wie unterscheiden sich die Methoden ACP und t-SNE?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Am Beispiel des MNIST-Datensatzes zeigt t-SNE eine deutliche Gruppierung \u00e4hnlicher Daten in Clustern (z.B. f\u00fcr Zahlen 1-6), w\u00e4hrend un\u00e4hnliche Daten voneinander getrennt werden. Bei der PCA ist die Trennung im zweidimensionalen Raum viel weniger deutlich: W\u00e4hrend einige Zahlen (wie 0) gut gruppiert sind, bleiben andere (wie 5) diffus verteilt.\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p><strong>Wenn du dich schon einmal f\u00fcr Methoden zur Dimensionsreduktion interessiert hast, hast du dich wahrscheinlich mit der Hauptkomponentenanalyse oder PCA besch\u00e4ftigt. In diesem Artikel werden wir uns mit einer der anderen Methoden zur Dimensionsreduktion besch\u00e4ftigen, die es gibt: t-SNE f\u00fcr t-distributed Stochastic Neighbor Embedding (t-distributed Stochastic Neighbor Embedding). Dieser Algorithmus bietet einen anderen Ansatz als die PCA.<\/strong><\/p>\n","protected":false},"author":47,"featured_media":165496,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-165495","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165495","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=165495"}],"version-history":[{"count":5,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165495\/revisions"}],"predecessor-version":[{"id":219133,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165495\/revisions\/219133"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/165496"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=165495"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=165495"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}