Microsoft hat im Mai 2026 einen Meilenstein gesetzt: Mit den Computer-Using Agents in Copilot Studio können Unternehmen jetzt KI-Agenten bauen, die Software über deren Benutzeroberfläche bedienen - so, wie es sonst ein Mensch mit Maus und Tastatur tut. Seit dem 13. Mai 2026 ist die Funktion allgemein verfügbar und in allen kommerziellen Power-Platform-Regionen ausgerollt. Damit ist Microsoft der erste große Cloud-Anbieter, der produktionsreife Computer-Bedienung durch Agenten anbietet.
Für kleine und mittlere Unternehmen ist das mehr als eine technische Randnotiz. Viele KMU arbeiten mit Fachanwendungen, die keine moderne Schnittstelle bieten - alte Warenwirtschaft, Branchensoftware, Web-Portale von Lieferanten. Genau dort setzt die neue Technik an: Sie automatisiert auch dann, wenn eine klassische API fehlt.
Was Computer-Using Agents konkret leisten
Ein Computer-Using Agent betrachtet einen Bildschirm, erkennt Schaltflächen und Eingabefelder und führt darauf Aktionen aus. Er liest aus, klickt, tippt und navigiert durch Anwendungen - ganz gleich, ob es sich um eine Website oder ein Desktop-Programm handelt. Der entscheidende Fortschritt: Diese Agenten sind robuster geworden. Ändert sich ein Bildschirm oder eine Maske, brechen sie nicht sofort ab, sondern passen sich an. Das war bei klassischer Bildschirm-Automatisierung lange das größte Problem.
Der technische Kniff dahinter: Statt sich auf starre Bildschirm-Koordinaten oder feste Element-Bezeichner zu verlassen, nutzt der Agent Bildverstehen und Schlussfolgern. Er "sieht" die Oberfläche so, wie ein Mensch sie sieht, und entscheidet daraus den nächsten sinnvollen Schritt. Verschiebt sich ein Button oder ändert eine Software ihr Layout nach einem Update, findet der Agent das Ziel meist trotzdem. Genau diese Robustheit war bei der klassischen, koordinatenbasierten Bildschirm-Automatisierung der Vergangenheit das Dauerproblem.
Microsoft hat die Funktion zudem auf Unternehmensbetrieb ausgelegt. Zugangsdaten lassen sich sicherer verwalten - etwa über Azure Key Vault - und jede Sitzung wird über Microsoft Purview protokolliert. Organisationen können pro Szenario das passende Modell wählen, je nach Anforderung an Tempo, Qualität und Kosten. Zum Start stehen unter anderem das OpenAI-Modell für Computer-Bedienung und Claude Sonnet 4.5 als allgemein verfügbare Optionen bereit.
Mehr als nur Klicks: das Gesamtpaket im Mai-Update
Die Bildschirm-Bedienung kommt nicht allein. Das Mai-2026-Update von Copilot Studio bündelt mehrere Neuerungen, die zusammen ein durchgängiges Automatisierungssystem ergeben:
- Eingebettete Workflows: Computer-Using Agents lassen sich direkt in mehrstufige Abläufe integrieren, die API-Aktionen, Freigaben und Geschäftslogik kombinieren.
- Agent-to-Agent-Kommunikation (A2A): Ebenfalls allgemein verfügbar - Agenten können Informationen austauschen, Aufgaben delegieren und systemübergreifend zusammenarbeiten.
- Bessere Orchestrierung: Eine neue Steuerungsebene verbessert die Ausführung von Geschäftsprozessen um rund 20 Prozent und senkt zugleich den Token-Verbrauch um etwa 50 Prozent.
- Modellvielfalt: Neben GPT-5 stehen unter anderem Claude Sonnet 4.5, Sonnet 4.6 und Claude Opus für Produktiv-Agenten bereit.
Besonders die verbesserte Orchestrierung ist für KMU bares Geld wert. Eine zuverlässigere Ausführung bedeutet weniger Abbrüche und Nacharbeit, und ein geringerer Token-Verbrauch senkt unmittelbar die laufenden Kosten - ein Punkt, der bei wachsender Nutzung schnell ins Gewicht fällt. Die Agent-to-Agent-Kommunikation wiederum erlaubt es, Aufgaben aufzuteilen: Ein spezialisierter Agent recherchiert, ein zweiter formuliert, ein dritter trägt das Ergebnis ins Zielsystem ein. So entstehen aus einfachen Bausteinen erstaunlich fähige Abläufe, ohne dass ein einzelner Agent alles können muss.
Typische Einsatzszenarien für KMU
Der Reiz liegt in alltäglichen, ungeliebten Routinen. Überall dort, wo Mitarbeitende Daten von einem System ins nächste übertragen, kann ein Agent übernehmen:
- Bestelldaten aus einem Lieferanten-Portal in die eigene Warenwirtschaft übertragen.
- Rechnungen aus dem E-Mail-Postfach in ein Buchhaltungsprogramm einpflegen.
- Stammdaten zwischen CRM und einer älteren Branchensoftware abgleichen.
- Wiederkehrende Reports aus mehreren Anwendungen zusammenstellen.
Der gemeinsame Nenner all dieser Aufgaben: Sie sind häufig, regelbasiert und binden teure Arbeitszeit, ohne Wertschöpfung zu schaffen. Genau hier rechnet sich Automatisierung am schnellsten. Ein Mitarbeiter, der bisher jeden Morgen 45 Minuten mit dem Übertragen von Bestelldaten verbrachte, gewinnt diese Zeit für Aufgaben zurück, die Urteilsvermögen und Kundenkontakt erfordern - also genau das, was eine Maschine nicht leisten kann.
Computer-Using Agents oder klassische API - was ist sinnvoller?
Trotz aller Begeisterung gilt: Die Bildschirm-Bedienung ist nicht in jedem Fall der beste Weg. Bietet eine Anwendung eine saubere Schnittstelle, ist die direkte Anbindung über diese API in der Regel schneller, günstiger und stabiler. Computer-Using Agents spielen ihre Stärke dort aus, wo es eben keine Schnittstelle gibt - bei alter Branchensoftware, abgeschotteten Portalen oder Anwendungen, deren Hersteller keine Integration vorsieht.
Eine einfache Faustregel hilft bei der Entscheidung:
- Gibt es eine API oder einen fertigen Connector? Dann nutzen Sie diesen - er ist robuster und meist kostengünstiger im Dauerbetrieb.
- Fehlt jede Schnittstelle? Dann ist der Computer-Using Agent oft die einzige Brücke, ohne die Software auszutauschen.
- Ändert sich die Oberfläche ständig? Prüfen Sie, ob die Anwendung stabil genug ist - bei sehr häufigen Layout-Wechseln steigt der Pflegeaufwand auch für einen lernfähigen Agenten.
Governance nicht vergessen
Mit der Macht, beliebige Software zu bedienen, wächst die Verantwortung. Microsoft hat darum auch die Verwaltung ausgebaut: Administratoren können Erstanbieter-Agenten in großem Stil installieren und herrenlose Agenten automatisch an zuständige Verantwortliche zuweisen. Für KMU heißt das: Legen Sie von Beginn an fest, welche Agenten existieren, wer sie betreut und welche Berechtigungen sie haben. Sonst entsteht schnell ein Wildwuchs, der schwer zu kontrollieren ist.
Lohnt sich der Einstieg jetzt?
Wer bereits Microsoft 365 nutzt, hat die naheliegende Plattform schon im Haus. Der Wechsel von der öffentlichen Vorschau zur allgemeinen Verfügbarkeit bedeutet, dass die Funktion produktiv eingesetzt werden darf und Microsoft sie aktiv unterstützt. Das senkt das Risiko spürbar. Sinnvoll ist ein Start mit einem klar umrissenen Prozess, an dem sich der Nutzen messen lässt - etwa die Zeitersparnis bei der Datenübertragung.
So gehen Sie den ersten Schritt
Ein erfolgreicher Einstieg folgt keinem Big Bang, sondern einem überschaubaren Pilotprojekt. Bewährt hat sich diese Reihenfolge:
- Prozess auswählen: Suchen Sie eine Routine, die häufig vorkommt, klar beschrieben ist und heute manuell erledigt wird - idealerweise eine, über die sich Ihr Team ohnehin ärgert.
- Erfolg messbar machen: Halten Sie vorher fest, wie viel Zeit der Vorgang heute kostet. Nur so lässt sich der Gewinn später belegen.
- Mit Freigabe starten: Lassen Sie den Agenten zunächst unter Aufsicht laufen und kritische Schritte zur Bestätigung vorlegen. Erst wenn die Qualität überzeugt, geben Sie mehr Autonomie frei.
- Sauber dokumentieren: Legen Sie fest, was der Agent tun darf, wer ihn betreut und wie Fehler gemeldet werden.
So entsteht innerhalb weniger Wochen ein belastbarer Erfahrungswert - und eine fundierte Grundlage für die Entscheidung, ob und wo sich weitere Prozesse lohnen.
Fazit
Computer-Using Agents schließen eine Lücke, die KMU jahrelang gebremst hat: die Automatisierung von Software ohne moderne Schnittstelle. Mit der allgemeinen Verfügbarkeit seit Mai 2026 ist die Technik aus dem Versuchsstadium heraus. Entscheidend bleibt eine saubere Auswahl der Anwendungsfälle und eine klare Governance. Dann wird aus der Neuerung ein echter Produktivitätsgewinn statt einer weiteren Baustelle.
Sie möchten Computer-Using Agents in Copilot Studio für Ihre Prozesse nutzen? Cryon steht Ihnen mit Erfahrung in der Microsoft-Welt zur Seite - von der Konzeption über die Einrichtung bis zur sicheren Governance. Gemeinsam finden wir die Abläufe, die sich für Ihr Unternehmen wirklich automatisieren lassen.
Software-Aufgaben automatisieren lassen?
Ob Copilot-Integration oder eigene Automatisierung: Wir bauen Lösungen, die wirklich Arbeit abnehmen.

