So schlägt sich Microsoft Copilot auf dem COBOL-Mainframe

Ein Erfahrungsbericht von Sahana Kalahasthireddy, Lead Software Engineer bei FIS Global, zeigt, wie Microsoft Copilot ein Jahr lang in einer produktiven COBOL-Codebasis auf dem Mainframe eingesetzt wurde – unter realen Bedingungen in einem regulierten Bankenumfeld. Gängige Einschätzungen, wonach KI entweder COBOL-Entwickler bald ersetzen werde oder im Legacy-Umfeld kaum relevant sei, greifen aus ihrer Sicht zu kurz.

Entscheidend sei vielmehr der konkrete Einsatzkontext. In regulierten Umgebungen bestehe häufig kein Zugriff auf Plattformen wie GitHub. Stattdessen habe sie mit M365 Copilot innerhalb der gesicherten Unternehmensumgebung gearbeitet – mit einem bewusst manuellen Workflow über Textdateien und Copilot in Teams. Diese Einschränkung habe sich als Vorteil erwiesen, da sie zu präziseren Prompts und besseren Ergebnissen geführt habe.

Wo Copilot Mehrwert schafft

Im praktischen Einsatz habe sich Copilot vor allem bei klar strukturierten, wiederholbaren Aufgaben bewährt. Ein Beispiel ist die Generierung von DDL-Strukturen aus DCLGEN-Variablen. Nachdem ein passendes Muster etabliert worden sei, habe sich der Aufwand für drei Programme mit insgesamt rund 150 Feldern von 25 bis 37 Stunden auf etwa zwei bis drei Stunden reduziert.

Ein noch größerer Effekt habe sich beim Klonen komplexer Programme gezeigt. Die Erstellung dreier ähnlicher Programme auf Basis eines bestehenden Systems habe sich von rund 60 Arbeitstagen auf etwa 45 Tage verkürzt – eine Einsparung von rund 15 Arbeitstagen beziehungsweise etwa 120 Stunden.

Zusätzliche Effizienzgewinne sieht die Autorin bei der Dokumentation, wo erste Entwürfe in kurzer Zeit erstellt werden konnten, sowie bei der Optimierung bestehender DB2-Abfragen und der Identifikation fehlender Variablendefinitionen.

In Summe beziffert Kalahasthireddy die Zeitersparnis bei den von ihr beschrieben Tasks auf rund 150 bis 170 Stunden. Daraus ergebe sich auch ein klarer wirtschaftlicher Effekt: Je nach Markt entspreche dies Einsparungen im mittleren vierstelligen bis deutlich fünfstelligen US-Dollar-Bereich. Die vergleichsweise geringen Lizenzkosten von Copilot würden sich damit bereits im Rahmen eines einzelnen Projekts mehrfach amortisieren.


Vergleich von manuellem Aufwand und Copilot-Einsatz in ausgewählten COBOL-Mainframe-Use-Cases (Quelle: Sahana Kalahasthireddy, FIS Global, LinkedIn, 30.03.2026)

Stärken bei Mustern – Schwächen bei Neuentwicklung

Gleichzeitig zeige sich ein klares Leistungsprofil: Copilot funktioniere besonders gut bei der Übertragung vorhandener Muster. Ohne konkrete Beispiele stoße die KI jedoch an Grenzen. Die Generierung komplexer SQL-Statements oder eigenständige COBOL-Rewrites lieferten laut der Autorin keine verlässlichen Ergebnisse. Hier zeigt sich ein vergleichbares Muster zur jüngsten Causa Claude / COBOL.

Auch beim Testing besteht nach Einschätzung der Expertin weiterhin eine zentrale Lücke: Eine Unterstützung für Tests in z/OS-Umgebungen sei derzeit nicht gegeben, die Validierung bleibe Aufgabe der Entwickler.

Mit spezialisierten Lösungen wie IBM Bob könnten sich diese Einschränkungen perspektivisch verringern, etwa durch ein besseres Verständnis kompletter Codebasen und ihrer Abhängigkeiten. Der grundsätzliche Testaufwand bleibe jedoch bestehen.

Der Erfahrungsbericht bestätigt damit das bekannt differenzierte Bild: KI kann auch im Mainframe-Umfeld produktiv eingesetzt werden – ihr Nutzen hängt jedoch stark davon ab, wie gut sie in bestehende Prozesse und Rahmenbedingungen eingebettet wird. (td)