{"id":175893,"date":"2026-02-20T14:35:43","date_gmt":"2026-02-20T13:35:43","guid":{"rendered":"https:\/\/liora.io\/de\/?p=175893"},"modified":"2026-02-20T14:35:44","modified_gmt":"2026-02-20T13:35:44","slug":"die-varianzanalyse-anova-ein-tool-der-datenanalyse","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/die-varianzanalyse-anova-ein-tool-der-datenanalyse","title":{"rendered":"Die Varianzanalyse ANOVA: Ein Tool der Datenanalyse"},"content":{"rendered":"<p><strong>Die Varianzanalyse ANOVA (analysis of variance) ist eine einfache und h\u00e4ufig verwendete statistische Technik, um die Beziehung zwischen zwei (oder mehreren) Variablen zu untersuchen, insbesondere zwischen einer erkl\u00e4renden Variablen und einer Zielvariablen (oder abh\u00e4ngigen Variablen). Die ANOVA erm\u00f6glicht es uns zu verstehen, ob und wie die erkl\u00e4rende Variable die Zielvariable beeinflusst.<\/strong><\/p>\nDie <strong>Varianzanalyse ANOVA<\/strong> wird also in verschiedenen Kontexten und zu unterschiedlichen Fragestellungen mobilisiert, angefangen beim <a href=\"https:\/\/liora.io\/de\/data-marketing\">Marketing<\/a> bis hin zu wissenschaftlichen Studien in verschiedenen Bereichen (Medizin, Biologie, Demografie usw.). Wir k\u00f6nnen uns konkrete F\u00e4lle vorstellen, in denen die ANOVA eingesetzt werden kann.\n\nDer Leiter einer Kette mit 80 Gesch\u00e4ften m\u00f6chte wissen, ob sich eine Erh\u00f6hung der Helligkeit der Werbeplakate positiv auf die Verk\u00e4ufe auswirken kann. Er teilt seine Gesch\u00e4fte in vier Gruppen ein. Die erste Gruppe bittet er, die Helligkeit der Werbeplakate nicht zu ver\u00e4ndern. Dagegen bittet er die zweite, dritte und vierte Gruppe von Gesch\u00e4ften, die Helligkeit der Werbeplakate um 20 %, 40 % bzw. 60 % zu erh\u00f6hen. Einen Monat sp\u00e4ter berechnet er die durchschnittlichen Verkaufszahlen f\u00fcr jede der vier Gruppen. Er stellt Unterschiede fest: Der Helligkeitsgrad der Plakate scheint den Verkauf gef\u00f6rdert zu haben.\n\nDemografen m\u00f6chten den Effekt des Bildungsniveaus (unterhalb des Abiturs, Abitur, Bachelor, Master) auf das Einkommen untersuchen. Ausgehend von einer nationalen Studie, die 150.000 Personen in ganz Frankreich umfasste, berechneten sie das durchschnittliche Einkommen f\u00fcr jede dieser Schulstufen.\n\nSie stellen fest, dass sich die Durchschnittswerte unterscheiden und dass die Schulstufe einen positiven Effekt auf das Einkommen zu haben scheint.\n\nWie k\u00f6nnen der <strong>Gesch\u00e4ftsf\u00fchrer der Ladenkette<\/strong> und die Demografen sicher sein, dass es einen signifikanten Zusammenhang zwischen den Variablen gibt, die sie untersuchen (Helligkeit der Werbeplakate und Verk\u00e4ufe einerseits und Bildungsniveau und Einkommen andererseits) und dass die Unterschiede, die sie festgestellt haben, also real sind?\n\nGl\u00fccklicherweise k\u00f6nnen sie sich auf einen statistischen Test verlassen, der 1918 von dem britischen <strong>Biologen und Statistiker Fischer entwickelt wurde: die ANOVA.<\/strong>\n<h2>Was ist die Varianzanalyse ANOVA?<\/h2>\nDie Varianzanalyse <strong>ANOVA ist eine Technik der Inferenzstatistik,<\/strong> die entwickelt wurde, um zu testen, ob es einen signifikanten Zusammenhang zwischen zwei Variablen in zwei oder mehr Gruppen gibt.\n\nSie wird insbesondere dann eingesetzt, wenn wir wissen wollen, ob eine erkl\u00e4rende Variable (in unserem Beispiel die Helligkeit der Plakate und das Bildungsniveau) eine abh\u00e4ngige Variable (in unserem Beispiel die Verk\u00e4ufe in den Gesch\u00e4ften und das Einkommen) beeinflusst.\n\nEs ist wichtig zu beachten, dass im Fall der ANOVA die erkl\u00e4rende Variable eine kategoriale Variable ist, d.h. eine Variable, die Werte f\u00fcr eine Eigenschaft oder ein Merkmal enth\u00e4lt, die bzw. das nicht quantifizierbar ist. Andererseits ist die Zielvariable eine quantitative Variable, d. h. eine Variable, die in Zahlenwerten ausgedr\u00fcckt werden kann.\n\nDie ANOVA folgt der gleichen Logik wie ein Mittelwertvergleichstest wie der T-Test, aber im Gegensatz zum T-Test ist sie nicht auf die Analyse von zwei Gruppen beschr\u00e4nkt, sondern kann im Gegenteil eine Vielzahl von Gruppen ber\u00fccksichtigen: Das ist ihre St\u00e4rke.\n\nDas Ziel der ANOVA ist es, die Nullhypothese, die besagt, dass es keinen signifikanten Unterschied zwischen den untersuchten Gruppen gibt, zu verwerfen und die Alternativhypothese, die besagt, dass die festgestellten Unterschiede zwischen den Gruppen tats\u00e4chlich bestehen, beizubehalten. Um dies zu erreichen, setzt die <strong>Varianzanalyse ANOVA<\/strong>, wie der Name schon sagt, die Varianz zwischen den Klassen in Beziehung zur Varianz innerhalb der Klassen.\n\nDie Interklassenvarianz gibt die Varianz zwischen den Gruppen an, d. h., um auf eines unserer Beispiele zur\u00fcckzukommen, die Varianz zwischen den verschiedenen Gruppen, die durch ihren Bildungsgrad definiert sind. Die Varianz innerhalb der Klasse gibt die Varianz innerhalb jeder Gruppe an, die durch ihre Bildungsstufe definiert ist.\n\nDie Grundidee der ANOVA ist, dass je gr\u00f6\u00dfer das Verh\u00e4ltnis zwischen der Varianz zwischen den Klassen und der Varianz innerhalb der Klassen ist, desto gr\u00f6\u00dfer ist die Wahrscheinlichkeit, dass die Unterschiede zwischen den Gruppen tats\u00e4chlich bestehen.\n\nMit anderen Worten: Wenn die Varianz zwischen den Klassen gr\u00f6\u00dfer ist als die Varianz innerhalb der Klassen, k\u00f6nnen wir davon ausgehen, dass die beobachteten Unterschiede tats\u00e4chlich auf die Zugeh\u00f6rigkeit zu den verschiedenen Gruppen zur\u00fcckzuf\u00fchren sind: Wir k\u00f6nnen dann die Nullhypothese ablehnen. Das Verh\u00e4ltnis zwischen der Varianz zwischen den Klassen und der Varianz innerhalb der Klasse wird durch die F-Ratio ausgedr\u00fcckt.\n\nAuch interessant:<a href=\"https:\/\/liora.io\/de\/standardabweichung-in-excel-wozu-dient-sie-wie-wird-sie-berechnet\"> Standardabweichung Formel Excel<\/a>\n<h3>Wie wird der F Ratio berechnet?<\/h3>\nUm den<strong> F-Ratio zu berechnen<\/strong>, k\u00f6nnen wir unser Problem der Varianzanalyse in mehrere Schritte zerlegen. Wir beginnen damit, die Varianz zwischen den Klassen (\u00fcber die Gruppen hinweg) und die Varianz innerhalb der Klassen (innerhalb der Gruppen) zu berechnen.\n\nDazu m\u00fcssen wir die Summe der Quadrate der Abweichungen (SCE) zwischen den Gruppen berechnen.\n\nDie Formel lautet wie folgt:\n\nSCEInterclasse = [latex] sum_{k=1}^{n} u_{k} times (overline{Y_{k}}- overline{Y})^{2}[\/latex]\n<p style=\"text-align: center\">mit<\/p>\nk = die Anzahl der verschiedenen Gruppen[latex] overline{Y_{k}}[\/latex] = der Durchschnitt einer Gruppe[latex] overline{Y}[\/latex] = der Gesamtdurchschnitt\n\nDie <strong>SCEInterklasse<\/strong> kann auch als die Gesamtvariation in der abh\u00e4ngigen Variable verstanden werden, die durch die unabh\u00e4ngige Variable erkl\u00e4rt werden kann.\n\nAls N\u00e4chstes werden wir die <strong>Intraklassen-Quadratsumme<\/strong> berechnen, d. h. die Summe der Quadrate der Abweichungen innerhalb der Gruppen. Wir werden sie SCEIntraclass nennen.\n\nDie Formel zur Berechnung der Summe der Quadrate der Abweichungen innerhalb der einzelnen Gruppen lautet wie folgt:\n\nSCEIntraclasse = [latex] sum_{k=1}^{n} u_{k} times (overline{Y_{i}}- overline{Y_{k}})^{2}[\/latex]\n<p style=\"text-align: center\">mit:<\/p>\n[latex] overline{Y_{i}}[\/latex] = jede einzelne Punktzahl innerhalb der Gruppe[latex] overline{Y_{k}}[\/latex] = der Durchschnitt der Gruppe\n\nZusammen bilden die Interklassenvarianz und die Interklassenvarianz die Gesamtvarianz in unseren Beobachtungen. Diese kann wie folgt dargestellt werden:\n\nSCEGesamt = SCEInterklasse + SCEIntraklasse.\n\nAls N\u00e4chstes k\u00f6nnen wir unsere Freiheitsgrade berechnen.\n\nF\u00fcr SCEInterklasse werden die Freiheitsgrade bestimmt durch:\n\nDDLInterklasse = K &#8211; 1\n\nDabei ist K die Anzahl der Gruppen.\n\nF\u00fcr SCEIntraclass werden die Freiheitsgrade wie folgt bestimmt:\n\nDDLIntraklasse = N &#8211; k\n\nDabei gilt\n\nN = die Gesamtzahl der Beobachtungen\nk = die Anzahl der Gruppen.\n\nWir k\u00f6nnen nun den Durchschnitt der Interklassenquadrate berechnen, indem wir SCEInterklasse durch die DDL Interklasse dividieren.\n\n<strong>Mittelwert der klassen\u00fcbergreifenden Quadrate = SCEinterclass \/ DDLInterclass.<\/strong>\n\nWir k\u00f6nnen auf die gleiche Weise vorgehen, um den Durchschnitt der klasseninternen Quadrate zu berechnen:\n\n<strong>Mittelwert der Intraklassenquadrate = SCEinterklasse \/ DDLIntraklasse.<\/strong>\n\nWir sind am Ende unseres Weges angelangt und k\u00f6nnen nun endlich das F-Verh\u00e4ltnis (Fisher&#8217;s F) berechnen.\n\n<strong>F ratio = Mittelwert der Interklassenquadrate \/ Mittelwert der Intraklassenquadrate<\/strong>\n\nEine hohe F-Ratio zeigt an, dass die Varianz zwischen den Klassen gr\u00f6\u00dfer ist als die Varianz innerhalb der Klassen.\n\nDies erh\u00f6ht die Wahrscheinlichkeit, dass wir die Nullhypothese ablehnen und behaupten k\u00f6nnen, dass es tats\u00e4chlich einen Unterschied zwischen unseren Interessengruppen gibt.\n\nEs ist wichtig zu erw\u00e4hnen, dass wir, um eine Varianzanalyse ANOVA an unseren Daten durchf\u00fchren zu k\u00f6nnen, \u00fcberpr\u00fcfen m\u00fcssen, ob die Daten eine Reihe von Bedingungen erf\u00fcllen, insbesondere die Normalverteilung und die Unabh\u00e4ngigkeit unserer Stichproben.\n\nGenauer gesagt ist es notwendig, dass die untersuchte quantitative Variable eine Normalverteilung hat: Dies ist besonders wichtig bei kleinen Stichproben.\n\nAu\u00dferdem m\u00fcssen wir die Homoskedastizit\u00e4t untersuchen: Um eine <strong>Varianzanalyse ANOVA<\/strong> durchf\u00fchren zu k\u00f6nnen, m\u00fcssen alle untersuchten Gruppen eine gleiche (oder \u00e4hnliche) Varianz aufweisen.\n\nSchlie\u00dflich m\u00fcssen wir vor der Durchf\u00fchrung einer ANOVA \u00fcberpr\u00fcfen, ob die Beobachtungen unabh\u00e4ngig voneinander sind.\n\nAuch interessant: <a href=\"https:\/\/liora.io\/de\/4-arten-von-statistik-bias-die-du-in-deinen-analysen-vermeiden-solltest\">Statistik Bias die du kennen solltest<\/a>\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Mehr \u00fcber unsere Weiterbildungen<\/a><\/div><\/div>\n\n<h2>Two-Way ANOVA und Post-hoc-Tests<\/h2>\nDie Varianzanalyse ANOVA-Beispiele, die wir bisher vorgestellt haben, untersuchen die Beziehung zwischen einer erkl\u00e4renden Variablen (die Helligkeit der Plakate einerseits und das Bildungsniveau andererseits) und einer abh\u00e4ngigen Variablen:\n\nDiese einfache Version der <strong>Varianzanalyse ANOVA<\/strong> wird auch one-way anova oder Ein-Faktor-Anova genannt. In den meisten F\u00e4llen sind wir jedoch daran interessiert, die Auswirkungen von zwei oder mehr Variablen auf die abh\u00e4ngige Variable zu untersuchen.\n\nWir k\u00f6nnen uns z. B. fragen, ob das Geschlecht einer Person einen Einfluss auf ihr Einkommen hat und nicht nur ihr Bildungsniveau. In diesem Fall w\u00fcrden wir eine komplexere Version unserer <strong>ANOVA<\/strong> verwenden: die two-way anova.\n\nWenn wir nur eine einzige erkl\u00e4rende Variable haben, k\u00f6nnen wir eine einzige F-Ratio berechnen. Wenn jedoch signifikante Unterschiede von mehreren unabh\u00e4ngigen Variablen erzeugt werden, m\u00fcssen wir mehrere F-Quotienten berechnen.\n\nDie Zwei-Wege-Anova erm\u00f6glicht es uns, den Haupteffekt jeder einzelnen unabh\u00e4ngigen Variable zu bewerten, aber auch, ob es eine Interaktion zwischen ihnen gibt.\n\nDie ANOVA (One-way oder two-way) erm\u00f6glicht es uns, zu testen, ob es einen signifikanten Unterschied zwischen zwei oder mehreren Gruppen gibt.\n\nSie erlaubt uns jedoch nicht zu wissen, wo dieser Unterschied liegt. Anders ausgedr\u00fcckt: Wenn wir auf das Beispiel mit der Helligkeit der Werbeplakate zur\u00fcckkommen und feststellen, dass eine Erh\u00f6hung der Helligkeit der Plakate die Verk\u00e4ufe positiv beeinflusst, k\u00f6nnen wir uns fragen, welche Helligkeitsstufe f\u00fcr diese Erh\u00f6hung verantwortlich ist:\n\nWir k\u00f6nnen uns vorstellen, dass nur eine Erh\u00f6hung der Helligkeit der Plakate um 60 % einen positiven Effekt auf die Verk\u00e4ufe hat und dass die Erh\u00f6hungen um 20 % und 40 % keinen Effekt haben.\n\nUm diese Art von Hypothesen zu \u00fcberpr\u00fcfen, m\u00fcssen wir Post-hoc-Tests durchf\u00fchren. Die am h\u00e4ufigsten verwendeten Post-hoc-Tests sind der HSD-Test nach Tukey und die Bonferroni-Korrektur.\n\nDie <strong>ANOVA (one-way oder two-way)<\/strong> in Kombination mit diesen Tests erm\u00f6glicht ein gutes Verst\u00e4ndnis der Beziehung zwischen unseren interessierenden Variablen.\n\nDiese Techniken geh\u00f6ren zu den Werkzeugen, die ein <a href=\"https:\/\/liora.io\/de\/data-scientist-gehalt-wie-viel-verdienen-datenwissenschaftlerinnen\">Data Scientist<\/a> t\u00e4glich anwenden kann, um seine Daten zu verstehen. Sie helfen zu verstehen, ob und wie eine erkl\u00e4rende Variable eine Zielvariable beeinflusst. Die Ausbildung in Varianzanalyse ist daher ein wichtiger Schritt auf dem Weg zu einer Karriere als Data Scientist.\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/de\/unsere-aus-und-weiterbildungen\">Data Scientist Weiterbildungen<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Die Varianzanalyse ANOVA (analysis of variance) ist eine einfache und h\u00e4ufig verwendete statistische Technik, um die Beziehung zwischen zwei (oder mehreren) Variablen zu untersuchen, insbesondere zwischen einer erkl\u00e4renden Variablen und einer Zielvariablen (oder abh\u00e4ngigen Variablen). Die ANOVA erm\u00f6glicht es uns zu verstehen, ob und wie die erkl\u00e4rende Variable die Zielvariable beeinflusst. Die Varianzanalyse ANOVA wird [&hellip;]<\/p>\n","protected":false},"author":76,"featured_media":219220,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-175893","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175893","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/76"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=175893"}],"version-history":[{"count":2,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175893\/revisions"}],"predecessor-version":[{"id":218682,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/175893\/revisions\/218682"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/219220"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=175893"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=175893"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}