{"id":220086,"date":"2026-03-13T13:58:45","date_gmt":"2026-03-13T12:58:45","guid":{"rendered":"https:\/\/liora.io\/de\/agentrx-framework-ki-agenten-debugging"},"modified":"2026-03-13T13:58:45","modified_gmt":"2026-03-13T12:58:45","slug":"agentrx-framework-ki-agenten-debugging","status":"publish","type":"post","link":"https:\/\/liora.io\/de\/agentrx-framework-ki-agenten-debugging","title":{"rendered":"AgentRx Framework revolutioniert systematisches KI-Agenten-Debugging"},"content":{"rendered":"<p><strong>\nMicrosoft Research hat am 12. M\u00e4rz 2026 AgentRx pr\u00e4sentiert, ein Open-Source-Framework, das automatisch diagnostiziert, weshalb KI-basierte Agenten bei komplexen Aufgaben scheitern. Das Werkzeug ermittelt den genauen Schritt, an dem der Prozess eines Agenten nicht mehr wiederherstellbar ist, und erzielte in Tests mit 115 fehlgeschlagenen KI-gesteuerten Abl\u00e4ufen eine um 23,6 % h\u00f6here Genauigkeit als bisherige Verfahren.\n<\/strong><\/p>\n<p>Das System betrachtet die Ausf\u00fchrung von KI-basierten Agenten als \u00fcberpr\u00fcfbares Systemprotokoll und bietet Entwicklerinnen und Entwicklern einen evidenzbasierten, l\u00fcckenlosen Pr\u00fcfpfad zur Behebung komplexer Fehler, erkl\u00e4rt <b>Microsoft Research<\/b>.<\/p><br><p><b>AgentRx<\/b> arbeitet mit einer dreistufigen diagnostischen Pipeline. Zun\u00e4chst erstellt es ausf\u00fchrbare Bedingungen, die korrektes Agentenverhalten definieren, indem es Regeln aus spezifischen Werkzeugschemata wie g\u00e4ngigen OpenAPI-Spezifikationen sowie aus in nat\u00fcrlicher Sprache formulierten fachlichen Richtlinien kombiniert. Anschlie\u00dfend spielt das Framework den vollst\u00e4ndigen Ablauf des Agenten systematisch erneut ab und bewertet jede Aktion anhand dieser Vorgaben. Bei Verst\u00f6\u00dfen identifiziert es den ersten nicht mehr behebbaren Schritt als &#8222;kritischen Fehler&#8220;, sodass sich Entwicklerinnen und Entwickler auf den genauen Ursprung statt auf nachgelagerte Effekte konzentrieren k\u00f6nnen.<\/p>\n\n<h2 style=\"margin-top:2rem;margin-bottom:1rem;\">Performance-Validierung<\/h2><figure class=\"wp-block-image size-large\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"572\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-1024x572.jpg\" alt=\"Forschungsbericht, der sowohl Balkendiagramme als auch Datenanalysen zum systematischen Debugging von KI-Agenten zeigt.\" class=\"wp-image-220082\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-56x56.jpg 56w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-115x64.jpg 115w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-150x150.jpg 150w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-210x117.jpg 210w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-300x167.jpg 300w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-410x270.jpg 410w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-440x246.jpg 440w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-448x448.jpg 448w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-587x510.jpg 587w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-768x429.jpg 768w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-785x438.jpg 785w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-1024x572.jpg 1024w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-1250x590.jpg 1250w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-1440x680.jpg 1440w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-1536x857.jpg 1536w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-2048x1143.jpg 2048w, https:\/\/liora.io\/app\/uploads\/sites\/8\/2026\/03\/agentrx-framework-ai-agent-debugging-bericht-scaled.jpg 2560w\" sizes=\"(max-width: 1024px) 100vw, 1024px\"><\/figure>\n\n<p>Microsoft Research entwickelte den <b>AgentRx Benchmark<\/b>, um die Wirksamkeit des Frameworks zu \u00fcberpr\u00fcfen, und erstellte einen Datensatz aus <b>115 manuell annotierten, fehlgeschlagenen Abl\u00e4ufen<\/b> aus komplexen Aufgaben-Umgebungen, darunter \u03c4-bench, Flash und Magentic-One. Der Annotierungsprozess ergab eine detaillierte Fehlertaxonomie mit neun Kategorien, die unter anderem Probleme wie etwa mangelnde Plantreue und die <a href=\"https:\/\/liora.io\/de\/ai-hallucinations-algorithmische-fehlinterpretationen\">Erfindung von nicht in den Beobachtungen enthaltenen Informationen<\/a> umfasst.<\/p><br><p>Tests zeigten deutliche Verbesserungen gegen\u00fcber bestehenden LLM-basierten Prompting-Ans\u00e4tzen auf. <b>AgentRx<\/b> erzielte eine <b>absolute Verbesserung von 23,6 %<\/b> bei der Lokalisierung des kritischen Fehlers und eine <b>absolute Verbesserung von 19,4 %<\/b> bei der korrekten Identifikation der zugrundeliegenden Fehlerursachen gem\u00e4\u00df der Taxonomie, berichtete Microsoft Research.<\/p>\n\n<h2 style=\"margin-top:2rem;margin-bottom:1rem;\">Marktauswirkungen<\/h2>\n\n<p>Die Open-Source-Ver\u00f6ffentlichung sowohl des Frameworks als auch des annotierten Benchmarks positioniert <b>Microsoft<\/b> an der Spitze der Bestrebungen, die <a href=\"https:\/\/liora.io\/de\/databricks-uebernimmt-quotient-ai-ki-agenten\">Fehlerbehebung bei KI-basierten Agenten<\/a> systematischer und evidenzgetriebener zu gestalten. Das Werkzeug adressiert einen kritischen Engpass in der KI-Entwicklung, da Unternehmen zunehmend autonome Agenten f\u00fcr komplexe Aufgaben einsetzen.<\/p><br><p>Durch pr\u00e4zise, \u00fcberpr\u00fcfbare Diagnosen erm\u00f6glicht <b>AgentRx<\/b> Entwicklerinnen und Entwicklern, transparentere und verl\u00e4sslichere KI-gest\u00fctzte Systeme zu entwickeln. Microsoft Research lud die Community ein, diese Werkzeuge f\u00fcr ihre eigenen <a href=\"https:\/\/liora.io\/de\/was-ist-autogen\">agentenbasierten Arbeitsabl\u00e4ufe<\/a> zu nutzen und zur wachsenden Wissensdatenbank rund um kritische Fehlerbedingungen beizutragen.<\/p><br><p>Obwohl das Framework auf den getesteten Architekturen vielversprechende Ergebnisse liefert, bleibt die Leistungsf\u00e4higkeit bei Agentensystemen oder spezifischen Fehlermustern, die im Benchmark nicht abgebildet sind, unerforscht, was Chancen f\u00fcr die Weiterentwicklung und den Ausbau der diagnostischen F\u00e4higkeiten er\u00f6ffnet.<\/p>\n<div style=\"margin-top:3rem;padding-top:1.5rem;border-top:1px solid #e2e4ea;\">\n  <h3 style=\"margin:0 0 0.75rem;font-size:1.1rem;letter-spacing:0.08em;text-transform:uppercase;\">\n    Sources\n  <\/h3>\n  <ul style=\"margin:0;padding-left:1.2rem;list-style:disc;\">\n    <li>microsoft.com\/en-us\/research\/blog<\/li>\n  <\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Microsoft Research hat am 12. M\u00e4rz 2026 AgentRx vorgestellt, ein Open-Source-Framework, das automatisch diagnostiziert, warum KI-gesteuerte Agenten bei komplexen Aufgaben scheitern. Das Tool lokalisiert den exakten Schritt, an dem der Prozess des Agenten nicht mehr korrigierbar ist, und erzielt in Tests mit 115 fehlgeschlagenen KI-gesteuerten Verl\u00e4ufen eine um 23,6 % h\u00f6here Genauigkeit als bestehende Methoden.<\/p>\n","protected":false},"author":87,"featured_media":220084,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2475],"class_list":["post-220086","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-nachrichten"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/220086","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/users\/87"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/comments?post=220086"}],"version-history":[{"count":0,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/posts\/220086\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media\/220084"}],"wp:attachment":[{"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/media?parent=220086"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/de\/wp-json\/wp\/v2\/categories?post=220086"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}