Klartext: Anthropic Computer Use macht 2026 genau das, woran klassische RPA seit Jahren scheitert – es bedient Legacy-Software so, wie ein Mensch es tut. Kein API-Zugang nötig. Kein Code-Umbau. Der Agent sieht den Bildschirm, bewegt die Maus, tippt Text. Die harte Wahrheit: Das klingt einfacher, als es ist. Aber für eine ganz konkrete Nische ist es ein echter Game-Changer.
Was Computer Use wirklich ist – und was nicht
Anthropic hat Computer Use am 22. Oktober 2024 offiziell für Claude 3.5 Sonnet vorgestellt. Das Prinzip dahinter ist radikal simpel, was es so interessant macht: Claude macht einen Screenshot des Desktops, analysiert ihn, gibt dann konkrete Aktionen zurück – „Klick bei Koordinate x/y“, „tippe diesen Text“, „scrolle nach unten“. Das Host-System führt diese Aktionen aus, erstellt den nächsten Screenshot, sendet ihn zurück. Loop. Wiederholen bis Aufgabe fertig.
Wichtig, weil es oft missverstanden wird: Anthropic selbst steuert dabei nichts auf Ihrem Rechner. Claude liefert Entscheidungen, Ihre eigene Infrastruktur führt sie aus. Was an die API gesendet wird, sind Screenshots und Prompts – die eigentlichen Aktionen bleiben in Ihrer Umgebung. Das ist kein Randaspekt, das ist entscheidend für Compliance und Datenschutz.
Anthropic beschreibt den Ansatz bewusst als „Computer Skills“ statt vieler einzelner Tools. Der Gedanke dahinter: Statt für jeden Dienst und jede Anwendung einen eigenen Konnektor zu bauen, lernt der Agent, generell mit Bildschirmen umzugehen. Wie ein Mensch, der sich in neue Software einarbeitet. Ohne Einweisung, ohne Handbuch, ohne API-Dokumentation.
Seien wir ehrlich: Das ist konzeptuell ein Paradigmenwechsel. Ob er sich in der Praxis durchsetzt, ist eine andere Frage.
Das Legacy-Problem, das niemand lösen wollte
Jedes mittlere bis große Unternehmen hat sie: die Altlast-Systeme. ERP-Masken aus den 90ern, Java-Swing-Anwendungen ohne REST-Schnittstelle, Fachverfahren in Behörden, die auf Windows-XP-Ära-Architekturen laufen. Dazu kommen interne Admin-Oberflächen, die vor 15 Jahren gebaut wurden und seither niemand mehr anrühren wollte.
API-Integration? Nicht möglich, weil keine API vorhanden. Neubauprojekte? Kosten im siebenstelligen Bereich, Laufzeiten von Jahren, politische Blockaden intern. Klassische RPA-Tools? Die funktionieren so lange, bis sich ein Pixel auf der Oberfläche verschiebt, ein Pop-up auftaucht oder der Anbieter das Layout ändert – dann bricht der Bot ohne Vorwarnung zusammen.
Genau hier setzt Anthropic Computer Use an. Der Agent interpretiert visuelle Elemente semantisch, nicht koordinatenbasiert. Er „versteht“, dass der „Speichern“-Button ein Speichern-Button ist, auch wenn er nächste Woche drei Pixel weiter rechts sitzt. Das ist der entscheidende strukturelle Unterschied zu klassischen RPA-Ansätzen, die auf festen XPath-Selektoren oder Pixel-Koordinaten basieren.
Technische Analysen aus 2025/2026 bestätigen: Der derzeit solideste Anwendungsfall für Computer Use ist genau diese Nische – Legacy-Automation bei Anwendungen ohne brauchbare API, in Situationen, wo Tools wie Playwright nicht praktikabel sind. Das ist nicht nichts. Das ist für viele Unternehmen jahrelanger Schmerz, der sich plötzlich adressieren lässt.
Wie gut funktioniert es wirklich? Die Zahlen
Schluss mit dem Hype-Blick. Was sagen die Benchmarks? Bei einfachen, klar definierten Aufgaben erreicht Computer Use laut technischen Analysen eine Erfolgsquote von rund 70 bis 85 Prozent. Das klingt erst einmal ordentlich. Im Vergleich zu deterministischer Automation – klassische RPA in stabilen Umgebungen liegt nahe 100 Prozent – ist es aber eine deutliche Lücke.
Dazu kommt die Latenz: Pro Aktion im Vision-Action-Loop rechnen Sie mit 3 bis 10 Sekunden. Screenshot aufnehmen, an die API senden, Antwort empfangen, Aktion ausführen, nächsten Screenshot aufnehmen. Bei komplexen Workflows mit 20, 30 Schritten summiert sich das schnell auf Minuten. Für hochfrequente Backoffice-Prozesse, die tausende Male täglich laufen, ist das schlicht kein tragfähiger Ansatz.
Jede Interaktion verbraucht Token – Screenshots sind nicht kostenlos. Je höher die Frequenz der Screenshots, desto höher die Kosten. Das macht Desktop-Intelligenz via Computer Use derzeit vor allem für niedrigfrequente, aber manuell teure Aufgaben interessant: monatliche Berichte aus Legacy-Systemen ziehen, einmalige Datenmigrationen, gelegentliche Formularstrecken in Fachverfahren.
Meine Einschätzung: Wer Computer Use heute als vollwertigen RPA-Ersatz vermarktet, lügt entweder oder hat keine Produktionserfahrung. Als ergänzende Schicht für spezifische Legacy-Nischen ist es aber schon jetzt real einsetzbar – und das ist eine Aussage, die vor zwei Jahren noch niemand machen konnte.
Plattform-Reality-Check: macOS zuerst, der Rest wartet
Eine wichtige Einschränkung, die in vielen Berichten untergeht: Im offiziellen Anthropic-Produkt – Desktop-App für Claude Pro und Max – läuft Computer Use derzeit nur auf macOS. Windows und Linux sind explizit noch nicht unterstützt. SiliconANGLE zitiert Anthropic direkt: „One obvious limitation is that it currently only works with Mac computers.“
Für Enterprise-Umgebungen, die mehrheitlich auf Windows-Clients laufen, bedeutet das: Wer Computer Use produktiv einsetzen will, muss heute noch auf die API-Route gehen und einen eigenen Client bauen. Das ist technisch machbar, aber kein Plug-and-Play. Systemintegratoren arbeiten hier an eigenen Implementierungen – oft in virtualisierten Desktop-Umgebungen (VDI), um die Sicherheitsanforderungen einzuhalten.
Anthropic hat zusätzlich eine mobile Komponente angekündigt: Die App „Dispatch“ soll es ermöglichen, Aufgaben vom Smartphone aus an den Desktop zu delegieren. Praktisch gedacht – aber noch klar im Frühstadium.
Für Entwickler steht Computer Use als Beta-Tool im Claude API bereit, plattformunabhängig. Der API-Weg ist der pragmatische Enterprise-Pfad heute: eigene Sandbox-Umgebung, eigene Kontrolle, eigenes Logging.

Sicherheit und Governance: Was Sie nicht ignorieren dürfen
Ein Agent, der den gesamten Desktop sieht, sieht alles. E-Mails im Hintergrund. Passwörter, die kurz im Klartext erscheinen. Vertrauliche Dokumente, die offen sind. Das ist keine Paranoia, das ist das reale Szenario in einer nicht abgesicherten Umgebung.
Anthropic selbst setzt auf einen Permission-first-Ansatz: Der Agent muss explizit Zugang zu einer neuen Anwendung erhalten, die Session lässt sich jederzeit stoppen. Aber das reicht für ernsthafte Enterprise-Setups nicht aus. Laut Anthropics offiziellem Announcement ist der Betrieb in einer Sandbox-Umgebung ausdrücklich empfohlen – nicht optional.
Best Practice in produktiven Setups, wie sie Systemintegratoren 2025/2026 beschreiben: dedizierte, isolierte Desktop-Sessions auf VDI-Infrastruktur, eigene Testkonten mit minimalen Rechten, vollständiges Logging jedes Schritts inklusive Screenshots, menschliches Review bei kritischen Aktionen. Das ist kein Overkill. Das ist Pflicht.
Governance-seitig gilt außerdem: Screenshots und Prompts verlassen Ihre Umgebung und gehen an die Anthropic API. Für Daten mit besonderem Schutzbedarf – personenbezogene Daten, Gesundheitsdaten, Finanzinformationen – brauchen Sie eine klare Einschätzung, was auf dem Screen sichtbar ist, bevor der Agent läuft. Das ist ein Punkt, den viele Case-Studies bislang unter den Tisch fallen lassen.
Computer Use vs. klassische RPA: Die ehrliche Gegenüberstellung
Seien wir ehrlich über das Verhältnis dieser beiden Ansätze. Klassische RPA – Determinismus, Koordinaten, feste Selektoren – ist fragil gegenüber Oberflächen-Änderungen, aber nahezu fehlerfrei in stabilen Umgebungen. Computer Use ist robuster gegenüber Layout-Variationen, aber stochastisch: Ein Modell interpretiert, kein Algorithmus klickt.
Die Empfehlung aus technischen Fachkreisen lautet deshalb konsequent: Hybrid-Architektur. Deterministische Tools wie Playwright oder klassische RPA-Plattformen für stabile, API-basierte oder DOM-gesteuerte Flows. Computer Use für alles, was ausschließlich über die UI erreichbar ist und stark Legacy-geprägt bleibt. Kein Entweder-oder, sondern komplementärer Einsatz.
Das bedeutet auch: Computer Use ist kein RPA-Killer. Aktuelle Analysen zu KI-Agenten in Produktion 2026 betonen durchgängig, dass generalistische Desktop-Agenten am besten in Kombination mit spezialisierten Tools funktionieren – nicht als Ersatz dafür. Wer das ignoriert und Computer Use auf alle Automatisierungsaufgaben loslässt, wird Enttäuschungen erleben.
Was sich verändert: Die Grenze dessen, was automatisierbar ist, verschiebt sich. Systeme, die bislang schlicht nicht automatisierbar waren, weil keine Schnittstelle existiert, kommen plötzlich in den Bereich des Möglichen. Das ist die eigentliche strategische Aussage.
Konkrete Einsatzszenarien: Wo Computer Use heute schon Wert schafft
Abstrakte Stärken-Schwächen-Profile helfen wenig, wenn es um Budgetentscheidungen geht. Deshalb lohnt ein Blick auf konkrete Einsatzszenarien, in denen Anthropic Computer Use bereits 2026 produktiv eingesetzt wird – oder zumindest in belastbaren Piloten erprobt ist.
Szenario 1: Monatsabschluss-Reporting aus alten ERP-Systemen
Viele mittelständische Unternehmen führen ERP-Systeme, die zwar stabil laufen, aber keinerlei Export-API nach außen anbieten. Der Monatsabschluss bedeutet: Mitarbeitende öffnen zwanzig verschiedene Masken, kopieren Zahlen heraus, konsolidieren sie manuell in Excel. Das kostet zwei bis vier Stunden monatlich pro Person – multipliziert über mehrere Abteilungen. Computer Use kann diesen Ablauf vollständig übernehmen: Maske öffnen, Daten ablesen, in Zieldatei übertragen, nächste Maske. Niedrige Frequenz, hoher manueller Aufwand, kein API-Zugang – das ist der ideale Anwendungsfall.
Szenario 2: Behördliche Fachverfahren mit starrer Oberfläche
Bundesbehörden und Landesverwaltungen betreiben Fachverfahren, die seit Jahrzehnten unverändert laufen. Eine Modernisierung ist politisch und finanziell oft nicht durchsetzbar. Sachbearbeitende verbringen Stunden damit, identische Datensätze aus einem Quellsystem in ein Zielsystem zu tippen – weil eine direkte Schnittstelle nie gebaut wurde. Desktop-Intelligenz via Computer Use lässt sich hier als Brücke einsetzen: Der Agent bedient beide Systeme so, wie ein Mensch es täte, ohne dass an einer der beiden Anwendungen auch nur eine Zeile Code verändert werden muss. Gerade weil sich die Fachverfahren kaum ändern, ist auch die Fragilität des Ansatzes gering.
Szenario 3: Einmalige Datenmigration aus Altbeständen
Bei Fusionen, Systemumstellungen oder Archivierungsprojekten müssen oft Daten aus veralteten Systemen in neue Strukturen überführt werden. Der klassische Weg: aufwändige ETL-Skripte schreiben, die nur für diesen Einmalfall gelten, oder externe Berater engagieren. Computer Use bietet eine dritte Option: Der Agent navigiert durch das Altsystem, liest Datensätze aus, überträgt sie in das neue System – strukturiert, dokumentiert, mit vollständigem Audit-Log. Einmalig, nicht hochfrequent, daher sind Latenz und Tokenkosten kein K.-o.-Kriterium.
Anthropic Computer Use im Vergleich zu anderen KI-Agenten-Ansätzen
Computer Use steht nicht allein im Markt. Microsoft, Google und eine Reihe von Startups verfolgen ähnliche Ansätze mit unterschiedlichen Architekturen. Microsofts Copilot-Ökosystem setzt stark auf tiefe Integration in eigene Produkte – Word, Excel, Teams – und nutzt Graph-APIs statt Screenshot-basierter Steuerung. Das ist in Microsoft-Umgebungen deutlich effizienter, versagt aber außerhalb des Microsoft-Stacks genauso zuverlässig wie jeder andere konnektor-basierte Ansatz.
Google verfolgt mit seinem Android-Assistenten einen ähnlich generalistischen Ansatz auf Mobilgeräten – semantisches Verständnis von Oberflächen statt fester Selektoren. Die konzeptuelle Verwandtschaft zu Anthropic Computer Use ist offensichtlich, der Einsatzbereich aber ein anderer: mobile Consumer-Anwendungen statt Desktop-Legacy-Systeme.
Was Anthropic von diesen Ansätzen unterscheidet, ist der explizite Fokus auf Sicherheit und Kontrollierbarkeit des Agenten. Claude ist von Grund auf mit Constitutional AI entwickelt worden – einem Ansatz, der das Modell dazu bringt, bei unsicheren oder unklaren Situationen eher zu pausieren als zu raten. In einer Automatisierungsumgebung, wo ein falscher Klick Daten löschen oder Prozesse anstoßen kann, die schwer rückgängig zu machen sind, ist das kein Marketingargument, sondern ein praktischer Vorteil. Wer sich für die Weiterentwicklung dieser Agenten-Architektur interessiert, findet bei Claude Opus 4 und den neuesten Anthropic-KI-Agenten eine gute Einordnung des aktuellen Entwicklungsstands.
Der Punkt, an dem Computer Use gegenüber spezialisierten Konkurrenten verliert: Aufgaben, für die strukturierte Daten und APIs existieren. Wer Salesforce, SAP S/4HANA oder moderne Cloud-ERP-Systeme automatisieren will, sollte deren native APIs nutzen – das ist schneller, günstiger und zuverlässiger. Computer Use ist keine Universallösung. Es ist ein Werkzeug für eine spezifische, bislang schwer adressierbare Klasse von Problemen.
Generalistische Agenten: Die Vision dahinter
Anthropic verfolgt mit Computer Use explizit den Ansatz, Claude generelle „Computer Skills“ beizubringen – nicht eine Sammlung von Konnektoren für jeden Dienst. Das ist konzeptuell näher an dem, was KI-Forschende als „agentic era“ bezeichnen: Systeme, die quer über Anwendungen hinweg Aufgaben verstehen, planen und ausführen.
Ein Kommentar vom Januar 2026 beschreibt den 22. Oktober 2024 als den Moment, an dem sich die KI-Nutzung vom Chatbot zum „digitalen Mitarbeiter“ verschoben habe. Das ist eine attraktive Erzählung. Die harte Wahrheit: Wir sind davon noch entfernt. 70 bis 85 Prozent Erfolgsquote bei simplen Tasks ist kein Maßstab für den selbstständig arbeitenden digitalen Kollegen.
Aber die Richtung ist klar. Claude-Modelle – aktuell Claude 3.5 Sonnet als die Generation mit Computer-Use-Fähigkeit, die Claude 3 Opus in Benchmarks deutlich übertrifft – werden weiterentwickelt. Latenz sinkt. Erfolgsraten steigen. Die Frage ist nicht ob, sondern wann das Kosten-Nutzen-Verhältnis kippt. Wer heute Erfahrung mit den Grenzen und Stärken von Anthropic Computer Use aufbaut, wird dann schneller sein als die Konkurrenz, die noch darauf wartet, dass die Technologie „fertig“ ist.
KI-Skills und praktische Implementierungserfahrung sind dabei die kritische Engpassressource – Unternehmen, die bereits heute Piloten aufsetzen, bauen Vorsprung auf, den sich andere später teuer erkaufen müssen.
Was bleibt – und was jetzt zu tun ist
Computer Use ist 2026 kein Versprechen mehr. Es ist eine real einsetzbare Technologie mit klaren Stärken, klaren Grenzen und klarem Anwendungsbereich: Legacy-Systeme ohne API, manuelle Prozesse in Fachverfahren, sporadische aber aufwändige Datenoperationen in alten ERP-Masken. Genau dort, wo RPA versagt oder nie greifen konnte.
Wer im Enterprise-Kontext prüfen will, ob Computer Use zum eigenen Portfolio passt: Beginnen Sie mit einem isolierten Piloten. Echte Legacy-Anwendung, dedizierte Sandbox-Umgebung, begrenzter Scope, vollständiges Logging. Messen Sie Erfolgsrate, Latenz und tatsächliche Kosten pro Workflow. Dann vergleichen Sie ehrlich mit dem Status quo – manuelle Arbeitsstunden, Fehlerrate, Mitarbeiterbindung durch stupide Aufgaben.
Schluss damit, auf die perfekte, produktionsreife Version zu warten. Die gibt es nicht. Was es gibt, ist eine Technologie, die in ihrer Nische heute schon funktioniert – und morgen mehr können wird.
Die eigentliche Frage ist nicht, ob Ihr Unternehmen sich Computer Use leisten kann. Sie lautet: Können Sie es sich leisten, Ihre Legacy-Landschaft weiter unautomatisiert zu lassen, während andere schon experimentieren?





Was halten Sie von dem Thema? Hier können Sie mit anderen Leserinnen und Lesern ins Gespräch gehen.
Mitreden & diskutieren
Ihre Meinung zählt — teilen Sie Gedanken, Fragen oder Erfahrungen zu diesem Artikel.