„KI ist mehr ein Mittel zum Zweck und keine endgültige Lösung."
Diese Beobachtung von Sylvain Hellin, Managing Director des Leonard Obermeyer Centre an der TU München, beschreibt einen Wandel in der Bautechnologie. KI ist keine separate Produktkategorie mehr. Sie ist die Grundlage, auf der die nächste Generation von Werkzeug für die Baubranche aufgebaut wird.
Die Datenlücke, die die Baubranche definiert
Die Fertigungsindustrie hat ihre Produktivität in den letzten 22 Jahren verdoppelt. Die Baubranche schaffte 10%. Die jährliche Wachstumsrate: 0,4% für Bauen versus 3% für Fertigung.
Die Erklärung liegt nicht an einem einzelnen Faktor – Bauen ist einzigartig komplex. Aber ein Kernproblem ist der Mangel an Daten.
„In der Fertigung mit Dutzenden Sensoren überall oder SaaS-Anwendungen, die alles tracken – jede Mausbewegung, jede Zeitspanne – können wir Produkte gezielt verbessern", erklärt Hellin. „In der Baubranche haben wir das leider nicht. Bestenfalls gibt es einen Tagesbericht, meist nur einen wöchentlichen E-Mail-Bericht, der auf hoher Ebene den Fortschritt beschreibt. Das ist alles."
Jede hier vorgestellte Technologie löst einen Teil dieses Datenproblems – und schafft das Fundament für das, was kommt.
Von der Standortwahl bis zum As-Built-Modell: KI über den gesamten Baulebenszyklus
Initiale Phase: Was sollte ich hier bauen?
Matthias Zühlke verbrachte 15 Jahre als Architekt damit, diese Frage für Projektentwickler zu beantworten. Das hieß: Bebauungsdaten sammeln, Architekten einbinden, Energieberater beauftragen, Kostenkalkulationen durchführen. Wochen Arbeit, bevor klar war, ob ein Standort überhaupt vielversprechend ist.
syte, die von Zühlke mitgegründete Plattform, verwaltet digitale Zwillinge jedes Gebäudes in Deutschland – über 25 Millionen Immobilien. Anders als die meisten KI-Startups in der Baubranche entwickelte syte ein eigenes Foundational Model und gewann damit den deutschen KI-Award. „Wir bieten kein ChatGPT-basiertes Modell. Es ist unsere eigene KI."
Das Ergebnis: Der wochenlange Machbarkeitsprozess wird auf ein Minimum reduziert. Adresse eingeben, und syte liefert Baupotenzial, Energieanalyse, Marktdaten, Sanierungssimulationen und ROI-Berechnungen – alles auf Knopfdruck. Portfolio-Manager priorisieren jetzt Tausende Immobilien nach Sanierungspotenzial - eine Aufgabe, die vor Jahren im großen Maßstab undenkbar gewesen wäre.
„Die Kapazität von LLMs ist etwa 10x höher als vor drei, vier Jahren", beobachtet Zühlke. „Das ermöglicht uns Simulationen über Portfolios von einer Million Gebäuden."
Entwurfsphase: Können Nicht-Architekten räumliche Ideen erkunden?
Forscher der TUM stellen sich eine provokante Frage: Was, wenn ein Projektentwickler ohne architektonische Ausbildung Gebäudeentwürfe erkunden könnte, ohne einen Architekten zu beauftragen? Zum Test wurden Multi-Agenten-Systeme entwickelt, die aus natürlichsprachigen Prompts vollständige BIM-Modelle generieren.
„Ich möchte ein zweistöckiges Hotel mit acht Zimmern pro Etage. Ordne die Zimmer so an, dass vier Zimmer auf jeder Seite liegen, getrennt durch einen 4 Meter breiten Korridor."
Das LLM übersetzt dies in programmatische Befehle, die Vectorworks-BIM-Software steuern. Solibri-Modellprüfung validiert den Output, meldet Fehler zurück an den Agenten zur Korrektur. Die Schleife läuft, bis das Modell die Compliance-Prüfungen besteht.
Das Team ging noch weiter mit „Computer Use" – KI-Agenten erhalten direkte Kontrolle über Maus und Tastatur, genau wie ein Mensch die Software bedienen würde. Keine APIs, keine individuellen Integrationen. Der Agent sieht Screenshots seiner Arbeit, entscheidet, wo er klickt, gibt Befehle ein und iteriert. Das Ergebnis: etwa zehn Minuten, um aus einer handgezeichneten Skizze ein bearbeitbares BIM-Modell zu generieren.
„LLMs haben großes Potenzial, speziell Nicht-Designer – wie Projektentwickler – dabei zu unterstützen, in der frühen Entwurfsphase mit Entwurfsideen zu spielen", erklärt Hellin. Architekten sollten sich jedoch nicht sorgen: „Wir sind sehr weit davon entfernt, dass ein solches System die eigentliche Arbeit eines Architekten übernimmt."
Der aktuelle Output spiegelt diese Realität wider: Die Gebäude sehen aus wie Gebäude, sind aber längst nicht baureif. Was zählt, ist die Fähigkeit, die durch KI ermöglicht wird: Erstmals können Nicht-Architekten räumliche Konfigurationen erkunden, Layouts testen und Ideen iterieren – alles vor der Investition in professionelle Planungsleistungen.
Vergabe: Was kostet Bauen tatsächlich?
„Niemand weiß wirklich, was Bauen kostet", sagt Christoph Berner, Gründer und Geschäftsführer von Cosuno.
Das Problem sind nicht fehlende Daten – Cosuno hat 50 Milliarden Euro Bauvolumen verarbeitet, jede Position bepreist, Milliarden Datenpunkte gesammelt.
Das Problem: Diese Daten sprechen unterschiedliche Sprachen. Ein Auftragnehmer schreibt „drei rote Fenster". Ein anderer „Fenster, drei Stück, rot". Das menschliche Auge matcht dies sofort, aber das Matching über Millionen Positionen zu skalieren? Das war unmöglich – bis Cosuno drei Jahre KI auf ihrem proprietären Datensatz trainierte.
Das Ergebnis: 85% Genauigkeit beim Matching äquivalenter Positionen über nicht-standardisierte Formate. In der Praxis: Leistungsverzeichnis hochladen, Benchmark-Preise auf Positionsebene in Sekunden erhalten. Nutzer können jede Position gegen historische Angebote suchen oder komplette Leistungsverzeichnisse basierend auf erlernten Mustern generieren und optimieren.
Kürzlich launchte Cosuno einen KI-Agenten, der direkt im Leistungsverzeichnis arbeitet – Dokumente prüft, Verbesserungen vorschlägt und Änderungen mit einem Klick anwendet. Die Daten existierten schon immer, lagen aber in unterschiedlichen Formaten vor. Jetzt werden sie zu nutzbarer Intelligence.
Bauphase: Was passiert tatsächlich auf der Baustelle?
Zwei völlig unterschiedliche Ansätze adressieren diese Frage, beide mit dem gemeinsamen Ziel: strukturierte Daten generieren, wo vorher keine existierten.
Das TUM-Prozessmonitoring nutzt den visuellen Ansatz. Fabian Pfitzner installierte 27 Kameras auf fünf Münchner Baustellen, jede erfasst alle 30 Sekunden Bilder. Das Ergebnis: 4 Millionen Bilder, die Baustellen im Zeitverlauf dokumentieren. Aber Rohbilder allein bringen nichts.
Pfitzners Durchbruch: KI-Layering. Computer Vision identifiziert Ressourcen – Schalung, Silos, Arbeiter, Ausrüstung – und ordnet jede dem BIM-Modell zu. Jedes Bild wird zu einem Knoten in einem Wissensgraph, der Baukomponenten, Arbeiter, Ausrüstung und Zonen verbindet. Graph Neural Networks analysieren dann diese strukturierten Daten, um Prozesse zu erkennen: Beton laden, Material bewegen, gießen.
Es entstehen Aktivitätsdiagramme, die zeigen, wann Baustellen starten und stoppen – wichtiger noch: sie offenbaren Ausreißer. An einem Tag gab es beispielsweise null Aktivität. Korrelation mit Wetterdaten zeigte: Starker Wind hatte die Kräne lahmgelegt. Kombiniert mit Komplexitätsmetriken, Wetterdaten und Zeitplänen fließt dies in Vorhersagemodelle für die Dauer, bis bestimmte Aufgaben auf Baustellen abgeschlossen sind.
Versatiles Kran-Intelligenz wählt einen anderen Ansatz: IoT-Geräte mit Wägezellen und Sensoren an Kränen, die 32.000 Datenpunkte pro Tag und Baustelle generieren.
„Wenn Sie im Geschäft sind, Cash in Assets zu konvertieren, wollen Sie wahrscheinlich Kräne nutzen", sagt Nikolai Suvorov, Global Go-to-Market Leader bei Versatile.
Versatile nutzt Kransensoren, um den kritischen Pfad-Fortschritt zu tracken und damit die knappen Margen von Stahlbauern und Generalunternehmern zu schützen.
Versatile ist seit 2019 im Einsatz – „KI in der Baubranche gemacht, bevor KI in der Baubranche richtig heiß wurde" – und bedient unter anderem Vinci, Eiffage und Bouygues.
Das Konvergenzmuster – digitale Zwillinge werden endlich entfesselt
Was diese Technologien verbindet, sind nicht die KI-Techniken, sondern die Dateninfrastruktur, die sie schaffen.
Diese Konvergenz transformiert auch, was „digitaler Zwilling" in der Praxis bedeutet. Jahrelang versprach das Konzept viel, lieferte aber Frustration. Eigentümer drängten auf digitale Zwillinge, alle anderen in der Branche wehrten sich. „Die Dateneingabe, Datenaggregation und -pflege war ein ziemlich großer Aufwand", erinnert sich Suvorov an seine Erfahrung im US-Markt. „Irgendwann erzielte dieser Aufwand negative Returns. Nicht jeder war sehr diszipliniert beim Aktualisieren der Informationen."
„Einer der größten Vorteile von KI ist, diese manuelle Dateneingabe irgendwann zu eliminieren und diese Single-Source-of-Truth aktuell zu halten", erklärt Hellin. „Es ist sehr mühsam. Wenn man es hat, ist es sehr schön – man kann viel automatisieren, viele Workflows funktionieren sehr gut. Aber es aktuell zu halten und sicherzustellen, dass man sich auf alle im digitalen Zwilling gespeicherten Informationen verlassen kann, während sich der Gebäudezustand ständig ändert, ist ein sehr zeitaufwendiger und mühsamer Prozess."
Die hier vorgestellten Technologien greifen dieses Problem aus mehreren Winkeln an. Versatiles Kransensoren aktualisieren automatisch den As-Built-Status. TUMs kamerabasiertes Monitoring erfasst Fortschritt ohne manuelle Eingabe. syte pflegt Immobilienzwillinge auf nationaler Ebene präzise, weil KI die Datenaggregation übernimmt, die manuell unmöglich wäre.
Digitale Zwillinge werden erst praktikabel, wenn Daten automatisch fließen – ohne dass Menschen sie manuell eingeben müssen.
Es gibt auch das Output-Problem. Selbst wenn digitale Zwillinge existierten, erforderte das Bereitstellen nützlicher Informationen verschiedene Formate. „Es fühlte sich an, als bräuchte man 15, 20, 30 verschiedene Dashboards", bemerkt Suvorov. „Mit der Einführung von LLMs und anderen Mitteln, Informationen aus riesigen Datensätzen genau so zu erhalten, wie man sie will – ob Zahlen, Statement oder Dashboard – ist das jetzt viel einfacher." KI macht digitale Zwillinge nicht nur einfacher zu pflegen, sondern auch einfacher abzufragen.
Die Parallele zu den Produktivitätsgewinnen der Fertigung sind nicht KI-Algorithmen. Es sind Sensoren, überall. Strukturierte Daten, die ständig fließen. Systeme, die aus jeder Interaktion lernen.
Die Baubranche baut diese Infrastruktur jetzt auf. KI ist das Mittel. Das Ziel: eine 90-Prozentpunkte-Produktivitätslücke schließen.
Was diese Technologien für Bauprofis bedeuten
Für Projektentwickler: Machbarkeitsanalysen in der initialen Phase laufen nun in Stunden statt Wochen. sytes Plattform und TUMs Text-zu-BIM-Forschung repräsentieren die nahe Zukunft: schnellere Standortbewertung, räumliche Erkundung vor Architektenbeauftragung.
Für Generalunternehmer: Beschaffungs-Intelligence wird zum Wettbewerbsvorteil. Cosunos Positions-Matching und Preis-Benchmarks schaffen Preistransparenz, die bisher umfangreiche Erfahrung und historische Aufzeichnungen erforderte.
Für Projektmanager: Felderfassung wechselt von manuell zu automatisch. Ob durch kamerabasiertes Monitoring oder IoT-Sensoren – die Tendenz geht zu kontinuierlichen, strukturierten Daten darüber, was tatsächlich auf der Baustelle passiert.
Für Technologie-Strategen: Integration ist wichtiger als einzelne Tools. Welche Organisationen das volle Produktivitätspotenzial ausschöpfen, entscheidet sich daran, ob sie Daten nahtlos zwischen Immobilienanalyse, Design, Beschaffung, Finanzmanagement und Feldmonitoring fließen lassen können.
Zentrale Statistiken
- 0,4% — Durchschnittliche jährliche Produktivitätswachstumsrate in der Baubranche über 22 Jahre
- 3% — Durchschnittliche jährliche Produktivitätswachstumsrate der Fertigung im gleichen Zeitraum
- 10% vs. ~100% — Netto-Produktivitätszuwachs Baubranche versus Fertigung
- 4 Millionen — Erfasste Bilder über 5 Baustellen für TUMs Prozessmonitoring-Forschung
- 27 — Kameras pro TUM-Forschungsinstallation
- 32.000 — Tägliche Datenpunkte pro Kran durch Versatiles IoT-System
- 25+ Millionen — Deutsche Immobilien in sytes Digital-Twin-Datenbank
- 85% — Positions-Matching-Genauigkeit von Cosunos Ausschreibungs-KI
- 50+ Mrd. € — Über Cosunos Plattform verarbeitetes Bauvolumen






















