Die Kernfrage für Softwareentwickler im Jahr 2026 ist nicht, ob KI Code schreiben kann. KI kann Code schreiben. Die ökonomisch interessante Frage ist, welche Aufgaben des Entwicklers die KI in der Zuverlässigkeit erledigen kann, in der das Team ausliefern kann, und zu Fehlerkosten, die das Unternehmen tragen kann. Unser v1-Modell sagt: keine überschreitet sauber die Schwelle „Replaceable“, die meisten überschreiten die Schwelle „AI-augmented“, und der human-critical-Rest ist robuster, als es der Rahmen „wird KI Entwickler ersetzen“ zugesteht.
Die modellierten Aufgaben
Softwareentwicklung lässt sich schlecht in einen einzigen Topf zerlegen — der tatsächliche Arbeitsmix variiert je nach Unternehmen, Seniorität und Team — aber unser v1-Ausgangsdatensatz deckt eine repräsentative Bandbreite ab: Produktivcode gegen eine Spezifikation schreiben, Tests schreiben, Dokumentation schreiben, Systemarchitektur entwerfen, Produktionsfehler debuggen, Code-Review, Triage im Bereitschaftsdienst und Junior-Entwickler betreuen. Das sind die Aufgaben, die unsere v1-Fähigkeitsmatrix entlang neun Achsen bewertet.
Die zellgenaue Analyse
Produktivcode gegen eine klare Spezifikation zu schreiben, landet im AI-augmented-Bereich. Die Fähigkeit ist hoch, die Zuverlässigkeit ordentlich, aber die Fehlerkosten sind nicht vernachlässigbar, denn selbstbewusst falscher Code im großen Maßstab kostet Produktionsausfälle. Die Substitutionsklassen-Regeln gemäß ADR-016 verorten diese Aufgabe im Mittelband: Die KI erledigt den Großteil des Tippens, der Entwickler verantwortet die Entscheidungen, das Review und den Rollback-Plan.
Tests schreiben und Dokumentation schreiben sind in unserem v1-Ausgangsdatensatz ebenfalls AI-augmented — nicht Replaceable. Die Fähigkeit ist hoch (besonders bei Boilerplate), aber die Zuverlässigkeits- und Fehlerkostenschwellen halten beides außerhalb des Replaceable-Bands. Ein Test, der lokal besteht und den Produktions-Grenzfall verfehlt, trägt nicht vernachlässigbare Fehlerkosten. Eine Doku, die einen API-Vertrag selbstbewusst falsch darstellt, zieht jeden nachgelagerten Entwickler herunter. Die Rolle erhält KI-Unterstützung beim Tippen; der Entwickler verantwortet weiterhin die Korrektheit.
Code-Review — Feedback zu einem Diff formulieren — sitzt ebenfalls im AI-augmented-Bereich. Die Fähigkeit ist hoch, die Zuverlässigkeit mittel; die Fehlerkosten variieren je nach Diff (ein sicherheitsrelevantes Review kann bei 4 von 5 liegen, ein Styling-Review bei 1). Wir modellieren den Durchschnitt, was es im Mittelband hält.
Produktionsfehler zu debuggen fällt deutlich in Human-led + AI-assisted. Die Fähigkeit, einen Stacktrace per Mustererkennung zu deuten, ist hoch; die Fähigkeit zu synthetisieren, „warum passiert das nur um 2 Uhr nachts dienstags im Mandanten dieses Kunden“, ist gering. Die Zuverlässigkeitsachse ist hier brutal — die KI rät selbstbewusst und liegt oft falsch. Die Aufsichtsminuten pro Vorfall steigen. Die KI beschleunigt die Suche, verantwortet aber nicht den Fix.
Systemdesign und Architektur landet am tiefen Ende bei Human-led + AI-assisted. Die KI kann ein plausibles Architekturdiagramm erzeugen. Die KI kann nicht fünf Jahre an Tech-Debt-Entscheidungen, die Deployment-Vertrauenskurve des Teams und die tatsächliche Skalierungsentwicklung des Geschäfts gleichzeitig abwägen. Die Kontextachse des unersetzlichen menschlichen Werts liegt hoch; die Ambiguitätsachse noch höher. Die KI ist Resonanzboden, nicht Architekt.
Junior-Entwickler zu betreuen ist die Human-critical-Aufgabe der Rolle. Vertrauen liegt am oberen Ende der Skala des unersetzlichen Werts, der Kontext erstreckt sich über Jahre, und das Gespräch „warum hat dich der Senior in dem Meeting unterbrochen“ lässt sich nicht per Prompt entwerfen. Die KI kann technische Fragen beantworten; die KI kann nicht die Person sein, der ein Junior-Entwickler eine Karrierefrage anvertraut.
Grob über eine typische Woche
Für einen Softwareentwickler auf mittlerer bis Senior-Ebene in unserer v1-Referenzrolle ist die Basisverteilung über die modellierten Aufgaben: null Replaceable, mehrheitlich AI-augmented (Produktivcode, Tests, Doku, Code-Review), ein spürbares Human-led + AI-assisted-Band (Systemdesign, Bereitschaftstriage) und ein kleinerer Human-critical-Rest (Mentoring, Architekturentscheidungen mit mehrjährigem Kontext). Das Headline-Pill für die Rolle ist AI-augmented territory, aber die relevante Form ist, dass die Masse der Rolle in den mittleren beiden Klassen liegt.
Das ist die ruhig-ökonomische Lesart. Der Großteil der Woche liegt an der AI-augmentierten Grenze. Ein Teil ist weiterhin human-led. Das Narrativ „Softwareentwickler werden bis 2027 ersetzt“ ist nicht das, was das Modell sagt — Replaceable ist für die Rolle in v1 leer — und das Narrativ „KI ist überhypt, mein Job ist sicher“ ist ebenso wenig das, was das Modell sagt.
Wo sich das schnell ändert
Drei Achsen, die wir beobachten werden. Die Zuverlässigkeit ist der Hebel. Wenn die Zuverlässigkeitsachse bei der Feature-Implementierung von 75 auf 85 steigt, überschreitet die Zelle die Replaceable-Schwelle und das anteilsgewichtete Bild der Rolle verschiebt sich in Richtung 30–35 % Replaceable. Das ist die Diskontinuität im Klarna-Stil für die Softwareentwicklung.
Die Aufsichtsminuten sind der zweite Hebel. Der größte Teil der operativen KI-Kosten für Softwareentwicklungsaufgaben ist die Zeit der Prüfer, nicht die Token. Eine spürbare Reduktion der Aufsicht pro Output (etwa von 8 Minuten pro KI-generiertem PR auf 2) senkt die operative KI-Kostenlinie um fast das Vierfache. Das verändert die NPV-Rechnung für organisationsweite Ausrollungen.
Die Fehlerkosten-Konfiguration ist der dritte. Die Softwareentwicklung einer Bank hat error-cost-5 bei den meisten dieser Aufgaben; die Softwareentwicklung einer Marketing-Website hat error-cost-1. Dieselben Fähigkeits- und Zuverlässigkeitswerte erzeugen je nach Fehlerkosten-Konfiguration unterschiedliche Substitutionsklassen-Zuordnungen. Das Wagecard-Tool erlaubt dir, den Standard für deine Domäne zu überschreiben.
Was du damit anfängst, wenn du Softwareentwickler bist
Drei ruhig-ökonomische Schritte. Erstens: Erledige die AI-augmentierte Arbeit mit KI. Das ist die Hälfte deiner Woche. Sich dem zu verweigern, heißt Produktivität ohne methodischen Grund liegen zu lassen. Zweitens: Setze auf die Human-critical-Arbeit. Mentoring, Systemdesign mit Kontext, Bereitschaftstriage — das sind die Achsen, die das Cluster des unersetzlichen Werts weiterhin schützt. Es ist auch die Arbeit, die deine Karriere aufsummiert. Drittens: Beobachte die Zuverlässigkeitsachse. Wenn sie sich verschiebt, willst du der Entwickler sein, der bereits versteht, welche seiner Aufgaben betroffen sind.
Deine spezifische Wagecard zu berechnen dauert drei Minuten. Überschreibe die Standards, wenn deine Rolle abweicht (compliance-lastiges Backend, reguliertes Fintech, sicherheitskritisches Embedded). Die aus der Matrix abgeleitete Lesart findest du unter /roles/software-engineer; die Live-Rollenübersicht nach Geo × Erfahrung unter /insights/software-engineer. Methodik offen unter /methodology.
Die ehrliche Lesart ist, dass 2026 nicht das Jahr ist, in dem die Softwareentwicklung von oben bis unten umgekrempelt wird. Es ist das Jahr, in dem ein spürbarer Teil der Aufgabenfläche der Rolle in das AI-augmentierte Band gewandert ist und der Rest der Arbeit — der Human-critical-Teil — pro Stunde wertvoller wurde, nicht weniger.