{"id":165607,"date":"2026-02-18T07:01:10","date_gmt":"2026-02-18T06:01:10","guid":{"rendered":"https:\/\/liora.io\/de\/?p=165607"},"modified":"2026-02-18T16:31:32","modified_gmt":"2026-02-18T15:31:32","slug":"confusion-matrix","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/confusion-matrix","title":{"rendered":"Confusion matrix: Was genau ist das und wie wird sie angewendet?"},"content":{"rendered":"\n<p><strong>GDie Leistung eines Machine-Learning-Algorithmus steht in direktem Zusammenhang mit seiner F\u00e4higkeit, ein Ergebnis vorherzusagen. Wenn man versucht, die Ergebnisse eines Algorithmus mit der Realit\u00e4t zu vergleichen, verwendet man eine Konfusionsmatrix. In diesem Artikel erf\u00e4hrst du, wie du diese Matrix lesen kannst, um die Ergebnisse eines Klassifikationsalgorithmus zu interpretieren.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-was-genau-ist-eine-confusion-matrix\">Was genau ist eine Confusion matrix?<\/h2>\n\n\n\n<p>Beim <b>Machine Learning <\/b>wird ein Algorithmus mit Daten gef\u00fcttert, damit er selbstst\u00e4ndig lernt, eine bestimmte Aufgabe zu erledigen. Bei <b>Klassifikationsproblemen <\/b>sagt er Ergebnisse voraus, die mit der Realit\u00e4t verglichen werden m\u00fcssen, um seinen Leistungsgrad zu messen. Normalerweise wird die Konfusionsmatrix, auch <b>Kontingenztabelle <\/b>genannt, verwendet. Sie hebt nicht nur die richtigen und falschen Vorhersagen hervor, sondern gibt uns vor allem einen Hinweis auf die Art der Fehler, die gemacht wurden. Um eine Konfusionsmatrix zu berechnen, ben\u00f6tigt man einen <b>Testdatensatz und einen Validierungsdatensatz, der die Werte der erzielten Ergebnisse enth\u00e4lt.<\/b><\/p>\n\n\n\n<p>Jede Spalte der Tabelle enth\u00e4lt eine vom Algorithmus vorhergesagte Klasse und die Zeilen der tats\u00e4chlichen Klassen.<\/p>\n\n\n\n<p>Wir teilen die Ergebnisse in vier Kategorien ein:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>True Positive <\/b>(TP): Sowohl die Vorhersage als auch der tats\u00e4chliche Wert sind positiv.<\/li>\n<\/ul>\n\n\n\n<p>Beispiel: Eine kranke und eine erwartete kranke Person.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>True Negative <\/b>(TN): Die Vorhersage und der tats\u00e4chliche Wert sind negativ.<\/li>\n<\/ul>\n\n\n\n<p>Beispiel: Eine gesunde Person und eine geplante gesunde Person.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>False Positive <\/b>(FP): Die Vorhersage ist positiv, w\u00e4hrend der tats\u00e4chliche Wert negativ ist.<\/li>\n<\/ul>\n\n\n\n<p>Beispiel: Eine gesunde Person und eine geplante kranke Person.<\/p>\n\n\n\n<p><b>False Negative <\/b>(FN): Die Vorhersage ist negativ, w\u00e4hrend der tats\u00e4chliche Wert negativ ist.<\/p>\n\n\n\n<p>Beispiel: Eine kranke und eine geplante gesunde Person.<\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Sans-titre-3_Plan-de-travail-1-e1669819927162.webp\" alt=\"\" style=\"width:1000px;height:auto\" \/><\/figure>\n\n\n\n<p>Nat\u00fcrlich kann man dieser Matrix in komplizierteren F\u00e4llen Zeilen und Spalten hinzuf\u00fcgen.<\/p>\n\n\n\n<p><b>Beispiel: <\/b>Nach der Anwendung eines Vorhersagemodells erhalten wir folgende Ergebnisse<\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/Sans-titre-3-02-e1613474239886.webp\" alt=\"\" style=\"width:1000px;height:auto\" \/><\/figure>\n\n\n\n<p>Generell gilt, dass die richtigen Vorhersagen immer auf der Diagonalen zu finden sind.<\/p>\n\n\n\n<p>Wir haben hier also :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>600 Individuen wurden als Klasse A eingestuft, von insgesamt 2000 Individuen, was ziemlich wenig ist.<\/li>\n\n\n\n<li>Bei den Individuen der Klasse B wurden 1.200 von 2.000 tats\u00e4chlich als zu dieser Klasse geh\u00f6rig identifiziert.<\/li>\n\n\n\n<li>Bei den Individuen der Klasse C wurden 1.600 von 2.000 gut identifiziert.<\/li>\n\n\n\n<li>Die Zahl der True Positive (TP) liegt also bei 3.400.<\/li>\n<\/ul>\n\n\n\n<p>Um die Zahl False Positive (FP),True Negative (TN),False Negative (FN) zu erhalten. Es ist in dieser Tabelle nicht m\u00f6glich, sie direkt zu berechnen, daher m\u00fcsste man sie in drei F\u00e4lle aufteilen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>A und ( B und C)<\/li>\n\n\n\n<li>B und (A und C)<\/li>\n\n\n\n<li>C und (A und b)<\/li>\n<\/ul>\n\n\n\n<p>So kann man alle Metriken berechnen, die man f\u00fcr die Analyse dieser Tabelle ben\u00f6tigt.<\/p>\n\n\n\n<p>Hier findest du die g\u00e4ngigsten <b>Methoden, um <\/b>interessante Informationen aus einer solchen Tabelle zu ziehen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\n<ul class=\"wp-block-list\">\n<li><b>Accuracy<\/b><\/li>\n\n\n\n<li><b>Pr\u00e4zision<\/b><\/li>\n\n\n\n<li><b>Negative Predictive Value<\/b><\/li>\n\n\n\n<li><b>Spezifit\u00e4t<\/b><\/li>\n\n\n\n<li><b>Sensitivit\u00e4t\u00a0<\/b><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<p>In der Praxis gibt es in Python eine sehr einfache M\u00f6glichkeit, \u00fcber die Funktion classification_report der <a href=\"https:\/\/scikit-learn.org\/stable\/\">sklearn-Bibliothek<\/a> auf alle diese Metriken zuzugreifen.<\/p>\n\n\n\n<p><b>Beispiel:<\/b><\/p>\n\n\n\n<p>Dies f\u00fchrt zu folgendem Ergebnis:<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter is-resized\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/pasted-image-0-3.webp\" alt=\"\" style=\"width:auto;height:200px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-welche-metriken-verwenden-wir-um-unsere-vorhersagen-zu-bewerten\">Welche Metriken verwenden wir, um unsere Vorhersagen zu bewerten?<\/h2>\n\n\n\n<p>In diesem Fall haben wir uns daf\u00fcr entschieden, die verschiedenen Klassen nach den Werten von y_true zu benennen. Wir sehen dann verschiedene Metriken, die es uns erm\u00f6glichen, die Qualit\u00e4t unserer Vorhersagen zu beurteilen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Precision<\/strong><\/li>\n\n\n\n<li><strong>Recall<\/strong><\/li>\n\n\n\n<li><strong>F1-Score<\/strong><\/li>\n<\/ul>\n\n\n\n<p>Deren Formeln lauten jeweils :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Precision: Precision = True Positives \/ (True Positives + False Positives)<\/li>\n\n\n\n<li>Recall: Recall = True Positives \/ (True Positives + False Negatives)<\/li>\n\n\n\n<li>F1-score: F1-score = (2 * Precision * Recall) \/ (Precision + Recall)<\/li>\n<\/ul>\n\n\n\n<p>In unserem Fall kann man eine Genauigkeit von 0 f\u00fcr die Klasse 1 beobachten. Das liegt einfach daran, dass keine Person aus der tats\u00e4chlichen Klasse 1 als Mitglied dieser Klasse vorhergesagt wurde. Im Gegensatz dazu haben die Individuen der Klasse 2, bei denen 2 von 3 Individuen, die der Klasse 2 zugeordnet wurden, richtig zugeordnet wurden, eine Genauigkeit von 0,67.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-die-unterschiede-zwischen-micro-average-und-macro-average\">Die Unterschiede zwischen Micro-Average und Macro-Average<\/h3>\n\n\n\n<p>Die Berechnung und Interpretation dieser Mittelwerte unterscheidet sich leicht.<\/p>\n\n\n\n<p>Unabh\u00e4ngig von der verwendeten Metrik wird bei einem Makro-Mittelwert der Mittelwert aus der Berechnung der Metrik unabh\u00e4ngig von den Klassen gebildet. Im Gegensatz dazu ber\u00fccksichtigt ein Mikro-Mittelwert die Beitr\u00e4ge jeder Klasse, um die durchschnittliche Metrik zu berechnen.<\/p>\n\n\n\n<p>Bei einer Klassifizierung mit mehreren Klassen wird dieser Ansatz oft bevorzugt, wenn man ein Ungleichgewicht zwischen den Klassen vermutet (Anzahl, Bedeutung &#8230;).<\/p>\n\n\n\n<p>Beispiel:<\/p>\n\n\n\n<p>Dies f\u00fchrt zu folgendem Ergebnis:<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter is-resized\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2022\/11\/unnamed-4.webp\" alt=\"\" style=\"width:auto;height:200px\" \/><\/figure>\n\n\n\n<p>Du wei\u00dft jetzt, wie du die Ergebnisse eines Klassifikationsalgorithmus lesen und interpretieren kannst.<\/p>\n\n\n\n<p>Wenn du mehr dar\u00fcber erfahren m\u00f6chtest, kannst du dir unsere Kurse Data Analyst, Data Scientist und Data Manager ansehen, in denen diese Konzepte anhand konkreterer F\u00e4lle wiederholt werden.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/de\/weiterbildung\">Entdecken Sie unsere Schulungen<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Was genau ist eine Confusion matrix?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Beim Machine Learning wird ein Algorithmus mit Daten gef\u00fcttert, damit er selbstst\u00e4ndig lernt, eine bestimmte Aufgabe zu erledigen. Bei Klassifikationsproblemen sagt er Ergebnisse voraus, die mit der Realit\u00e4t verglichen werden m\u00fcssen, um seinen Leistungsgrad zu messen. Normalerweise wird die Konfusionsmatrix, auch Kontingenztabelle genannt, verwendet. Sie hebt nicht nur die richtigen und falschen Vorhersagen hervor, sondern gibt uns vor allem einen Hinweis auf die Art der Fehler, die gemacht wurden. Um eine Konfusionsmatrix zu berechnen, ben\u00f6tigt man einen Testdatensatz und einen Validierungsdatensatz, der die Werte der erzielten Ergebnisse enth\u00e4lt. Jede Spalte der Tabelle enth\u00e4lt eine vom Algorithmus vorhergesagte Klasse und die Zeilen der tats\u00e4chlichen Klassen. Wir teilen die Ergebnisse in vier Kategorien ein: True Positive (TP): Sowohl die Vorhersage als auch der tats\u00e4chliche Wert sind positiv. Beispiel: Eine kranke und eine erwartete kranke Person. True Negative (TN): Die Vorhersage und der tats\u00e4chliche Wert sind negativ. Beispiel: Eine gesunde Person und eine geplante gesunde Person. False Positive (FP): Die Vorhersage ist positiv, w\u00e4hrend der tats\u00e4chliche Wert negativ ist. Beispiel: Eine gesunde Person und eine geplante kranke Person. False Negative (FN): Die Vorhersage ist negativ, w\u00e4hrend der tats\u00e4chliche Wert negativ ist. Beispiel: Eine kranke und eine geplante gesunde Person. Nat\u00fcrlich kann man dieser Matrix in komplizierteren F\u00e4llen Zeilen und Spalten hinzuf\u00fcgen.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Welche Metriken verwenden wir, um unsere Vorhersagen zu bewerten?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"In diesem Fall haben wir uns daf\u00fcr entschieden, die verschiedenen Klassen nach den Werten von y_true zu benennen. Wir sehen dann verschiedene Metriken, die es uns erm\u00f6glichen, die Qualit\u00e4t unserer Vorhersagen zu beurteilen: - Precision - Recall - F1-Score Deren Formeln lauten jeweils : - Precision: Precision = True Positives \/ (True Positives + False Positives) - Recall: Recall = True Positives \/ (True Positives + False Negatives) - F1-score: F1-score = (2 * Precision * Recall) \/ (Precision + Recall) In unserem Fall kann man eine Genauigkeit von 0 f\u00fcr die Klasse 1 beobachten. Das liegt einfach daran, dass keine Person aus der tats\u00e4chlichen Klasse 1 als Mitglied dieser Klasse vorhergesagt wurde. Im Gegensatz dazu haben die Individuen der Klasse 2, bei denen 2 von 3 Individuen, die der Klasse 2 zugeordnet wurden, richtig zugeordnet wurden, eine Genauigkeit von 0,67.\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>GDie Leistung eines Machine-Learning-Algorithmus steht in direktem Zusammenhang mit seiner F\u00e4higkeit, ein Ergebnis vorherzusagen. Wenn man versucht, die Ergebnisse eines Algorithmus mit der Realit\u00e4t zu vergleichen, verwendet man eine Konfusionsmatrix. In diesem Artikel erf\u00e4hrst du, wie du diese Matrix lesen kannst, um die Ergebnisse eines Klassifikationsalgorithmus zu interpretieren. Was genau ist eine Confusion matrix? Beim [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":217983,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2472],"class_list":["post-165607","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ki"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165607","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=165607"}],"version-history":[{"count":4,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165607\/revisions"}],"predecessor-version":[{"id":218278,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/165607\/revisions\/218278"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/217983"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=165607"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=165607"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}