{"id":220149,"date":"2026-03-17T12:43:26","date_gmt":"2026-03-17T11:43:26","guid":{"rendered":"https:\/\/liora.io\/de\/stakeholder-audit-umdenken-spracherkennungs-ground-truth"},"modified":"2026-03-17T12:43:26","modified_gmt":"2026-03-17T11:43:26","slug":"stakeholder-audit-umdenken-spracherkennungs-ground-truth","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/stakeholder-audit-umdenken-spracherkennungs-ground-truth","title":{"rendered":"Stakeholder-Audit f\u00fchrt zum Umdenken bei Spracherkennungs-Ground-Truth"},"content":{"rendered":"<p><strong>\nForschende haben in Nature Machine Intelligence am Montag eine Studie ver\u00f6ffentlicht, welche die Testverfahren f\u00fcr KI-basierte Spracherkennungssysteme in Frage stellt. Sie argumentieren, dass die gegenw\u00e4rtigen Methoden den vielen legitimen Arten, gesprochene Sprache zu transkribieren, nicht Rechnung tragen. Das von Mona Sloane geleitete Team schl\u00e4gt vor, herk\u00f6mmliche Genauigkeitstests mit nur einer korrekten Antwort durch ein neues Framework zu ersetzen, das Feedback unterschiedlicher Stakeholder einbezieht, darunter Anwender, Entwickler und betroffene Gemeinschaften, um besser zu bewerten, ob diese KI-Systeme in verschiedenen Kontexten fair und effektiv funktionieren.\n<\/strong><\/p>\n<p>Das Kernproblem liegt in der Art, wie Genauigkeit gemessen wird. <b>Herk\u00f6mmliches <a href=\"https:\/\/liora.io\/de\/nlp-oder-natural-language-processing\">Automatic Speech Recognition (ASR) Testing<\/a><\/b> st\u00fctzt sich auf Metriken wie <b>Word Error Rate (WER)<\/b> und <b>Character Error Rate (CER)<\/b>, welche Systemausgaben mit einer einzigen Referenztranskription vergleichen. Nach Ansicht der Forschenden verkennt dieser Ansatz jedoch eine fundamentale Realit\u00e4t: Es gibt oftmals nicht nur eine einzige korrekte Art, menschliche Sprache zu transkribieren.<\/p><br><p>Stellen Sie sich eine medizinische Konsultation vor, in der eine Patientin oder ein Patient stottert oder F\u00fcllw\u00f6rter wie \u201e\u00e4hm&#8220; und \u201e\u00e4h&#8220; verwendet. Bei der klinischen Analyse kann es f\u00fcr die Diagnose entscheidend sein, diese Sprechmuster in der Transkription beizubehalten. F\u00fcr die Erstellung von Meeting-Zusammenfassungen oder Untertiteln w\u00e4re hingegen eine bereinigte Version ohne diese Elemente passender. Beide Transkriptionen sind legitim, so die Studie, was die herk\u00f6mmliche Vorstellung einer einzigen objektiven \u201eGround Truth&#8220; untergr\u00e4bt.<\/p>\n\n<h2 style=\"margin-top:2rem;margin-bottom:1rem;\">Ein neuer stakeholder-zentrierter Ansatz<\/h2><figure class=\"wp-block-image size-large\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"572\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-1024x572.jpg\" alt=\"Ein Team aus vier Fachleuten, das in einem modernen B\u00fcro an einem Holztisch mit Laptops, Dokumenten und Haftnotizen zusammenarbeitet.\" class=\"wp-image-220143\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-56x56.jpg 56w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-115x64.jpg 115w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-150x150.jpg 150w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-210x117.jpg 210w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-300x167.jpg 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-410x270.jpg 410w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-440x246.jpg 440w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-448x448.jpg 448w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-587x510.jpg 587w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-768x429.jpg 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-785x438.jpg 785w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-1024x572.jpg 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-1250x590.jpg 1250w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-1440x680.jpg 1440w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-1536x857.jpg 1536w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-2048x1143.jpg 2048w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/team-zusammenarbeit-im-byroumfeld-scaled.jpg 2560w\" sizes=\"(max-width: 1024px) 100vw, 1024px\"><\/figure>\n\n<p>Das Forschungsteam unter Leitung von <b>Mona Sloane<\/b> schl\u00e4gt vor, von Einzelreferenz-Genauigkeitstests zu einem stakeholder-zentrierten Auditing Framework \u00fcberzugehen. Dieses Konzept w\u00fcrde Endnutzer, Entwickler, Fachexperten und betroffene Gemeinschaften zusammenbringen, um gemeinsam zu bestimmen, was in spezifischen Kontexten als faire und zweckm\u00e4\u00dfige Spracherkennungs-Ausgabe gilt.<\/p><br><p>Anstatt lediglich die Abweichung von einer vorab definierten korrekten Antwort zu messen, w\u00fcrde dieser Ansatz einen strukturierten Dialog \u00fcber die tats\u00e4chliche Leistungsf\u00e4higkeit und Wirkung eines KI-Systems f\u00f6rdern. Das Framework priorisiert <b>kontextuelle Angemessenheit<\/b> gegen\u00fcber reinen <a href=\"https:\/\/liora.io\/de\/confusion-matrix\">Accuracy Scores<\/a> und k\u00f6nnte so zu gerechteren Spracherkennungstechnologien f\u00fchren, welche unterschiedlichen Nutzergruppen besser dienen.<\/p>\n\n<h2 style=\"margin-top:2rem;margin-bottom:1rem;\">Auswirkungen auf die Branche<\/h2>\n\n<p>Die vorgeschlagenen \u00c4nderungen k\u00f6nnten ma\u00dfgeblich beeinflussen, wie Technologieunternehmen Spracherkennungssysteme entwickeln und vermarkten. Gegenw\u00e4rtige Branchenstandards verlassen sich stark auf herk\u00f6mmliche Genauigkeitsmetriken f\u00fcr Produktvergleiche und regulatorische Konformit\u00e4t. Ein Wechsel zu einer stakeholder-zentrierten Evaluierung w\u00fcrde neue Benchmarks und potenziell h\u00f6here Entwicklungskosten erfordern.<\/p><br><p>Dennoch bleiben entscheidende Details zur Umsetzung unklar. Der Beitrag in <b>Nature Machine Intelligence<\/b>, publiziert am 16. M\u00e4rz 2026, ist noch nicht g\u00e4nzlich zug\u00e4nglich, sodass Fragen zu praktischen Einf\u00fchrungsh\u00fcrden, Skalierbarkeitsaspekten und konkreten Politikempfehlungen unbeantwortet bleiben. Zum Forschungsteam geh\u00f6ren die Co-Autorinnen und -Autoren <b>H. Schellmann<\/b> und <b>K.X. Mei<\/b>, doch die kompletten Framework-Spezifikationen stehen bislang aus.<\/p><br><p>Da KI-gest\u00fctzte Spracherkennung zunehmend in <a href=\"https:\/\/liora.io\/de\/data-science-im-gesundheitswesen\">Gesundheitssysteme<\/a>, Bildungswesen und Rechtssysteme integriert wird, k\u00f6nnte dieses Umdenken bei den Bewertungsverfahren pr\u00e4gen, wie diese kritischen Technologien branchen\u00fcbergreifend entwickelt, getestet und eingesetzt werden.<\/p>\n<div style=\"margin-top:3rem;padding-top:1.5rem;border-top:1px solid #e2e4ea;\">\n  <h3 style=\"margin:0 0 0.75rem;font-size:1.1rem;letter-spacing:0.08em;text-transform:uppercase;\">\n    Sources\n  <\/h3>\n  <ul style=\"margin:0;padding-left:1.2rem;list-style:disc;\">\n    <li>doi.org<\/li>\n  <\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>In Nature Machine Intelligence ver\u00f6ffentlichten Forschende am Montag eine Studie, die die Art und Weise in Frage stellt, wie KI-Spracherkennungssysteme getestet werden, und argumentiert, dass die aktuellen Methoden den verschiedenen legitimen Arten, gesprochene Sprache zu transkribieren, nicht gerecht werden. Das Team unter der Leitung von Mona Sloane schl\u00e4gt vor, traditionelle Single-Answer-Accuracy-Tests durch ein neues Rahmenwerk zu ersetzen, das Beitr\u00e4ge von diversen Stakeholdern, einschlie\u00dflich Nutzern, Entwicklern und betroffenen Gemeinschaften, einbezieht, um besser zu bewerten, ob diese KI-Systeme in unterschiedlichen Kontexten fair und effektiv funktionieren.<\/p>\n","protected":false},"author":87,"featured_media":220146,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2475],"class_list":["post-220149","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-nachrichten"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/220149","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/87"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=220149"}],"version-history":[{"count":0,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/220149\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/220146"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=220149"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=220149"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}