Letztes Wochenende habe ich spontan ein kleines Tool gebaut, das mir selbst schon öfter gefehlt hat. Nichts Kompliziertes, eher so ein Helfer für den Alltag: Eine Seite, auf der man seinen Urlaub planen kann inklusive Schulferien und Feiertagen für alle Bundesländer in Deutschland. Und das ganze kostenlos, ohne Registrierung und ohne dass irgendwas an einen Server gesendet wird. Alles bleibt lokal im Browser (bis auf die Calls für die Urlaube und Feiertage zu öffentlichen APIs).
Die Grundversion war überraschend schnell fertig. Zwei Tage, dann lief’s eigentlich ganz rund. Ich wollte einfach wissen, wie weit man mit modernen KI-Tools, wie GitHub Copilot, in kurzer Zeit kommt, wenn man sich mal zwei Tage lang voll drauf einlässt. Und das ging erstaunlich gut. Die Basisfunktionen standen schnell, aber dann ging natürlich das übliche Kleinklein los: Farben, Buttons, Abstände, Hover-Zustände, ein bisschen UX-Feinschliff hier und da. Dieser Teil dauert am Ende immer länger, als man denkt, auch wenn es nur kleine Entscheidungen sind. Aber genau die machen’s eben nutzbar.
Qualität oder Quantität?
Beim Erstellen der kleinen Anwendung bin ich eher in die Rolle des Product Owners mit technischen Wissen geschlüpft und habe dabei zwei Modelle instruiert. Claude Sonnet hat mich an ein paar Stellen überrascht, weil der Code, den er vorschlägt, oft lesbarer und strukturierter wirkt. Nur leider schleichen sich bei ihm/ihr auch öfter mal kleine Syntaxfehler ein, die man dann korrigieren muss. Er/Sie/Es versteht aber meistens sehr gut, was man will, und erklärt auch recht klar, warum was wie gemacht wurde. Das ist hilfreich, gerade wenn man nochmal gegenprüfen will, ob man selbst nicht irgendwo zu kompliziert denkt.
GPT war dagegen durchgehend stabiler, was die Syntax anging. Kaum Fehler, läuft einfach. Aber die Lösungen wirken öfter ein bisschen roh, so als würde da jemand sehr schnell sehr viel Code ausspucken, ohne nochmal drüber nachzudenken. Für einen Proof of Concept ist das in Ordnung, aber man merkt, dass da kein Gefühl für Struktur oder Lesbarkeit mitschwingt.
Richtig spannend wurde es beim Refactoring. Da zeigt sich, dass beide Modelle zwar gute Ideen haben können, sich aber auch schnell in ihrer eigenen Komplexität verlieren. Wenn etwas nicht sofort funktioniert, tendieren sie dazu, noch mehr Logik einzubauen, statt es einfacher zu machen. Man merkt dann richtig, wie ihnen der Überblick fehlt. Und vor allem fehlt ihnen diese menschliche Intuition, dieses „Moment mal, geht das nicht auch viel einfacher?“
Wie im echten Leben
Witzig finde ich, dass die KI wie ein echter Entwickler zum Overengineering neigt und man sie dann immer wieder einfangen muss. Dann erklärt man ihr, wie es einfacher ist, sie bedankt sich höflich, baut es neu, und plötzlich passt es. Es ist fast ein bisschen wie Pair Programming mit einem sehr höflichen, aber manchmal übereifrigen Kollegen.
Alles in allem war’s ein spannender Test. Der Urlaubsplaner funktioniert, tut, was es soll, und zeigt ganz gut, wie weit man heute mit KI-Assistenz kommt, wenn man sie nicht machen lässt, sondern führt. Es ersetzt keine Entwickler, aber es beschleunigt vieles, wenn man weiß, was man will und sich entsprechend präzise ausdrücken kann.
Falls du’s dir anschauen magst: urlaubistplanbar.de
Und wenn dir was auffällt – gern sagen.
