Skip to content

openclaw: Die heimliche Revolution hin zu echten K.I.-Agenten – Alles, was Sie für den Start wissen sollten

Weil auf Linkedin alle so viel Angst vor einer Krabbe hatten, musste ich es selbst ausprobieren. Ein langes Wochenende und ein paar falsche Konfigurationen später habe ich auch eine openclaw-Maschine! Was mache ich jetzt damit?

Spoiler: Alles. Automate the Boring Stuff lebe ich schon seit 2020 intensiv und sobald ich eine Aufgabe wiederholt erledige, schaue ich was ich daran wie automatisieren kann. Und jetzt, mit openclaw, ist wirklich alles Vorstellbare auch umsetzbar. Das ist absurd.

TLDR:

  1. Warum der Hype? Weil ich endlich einen Computer habe, dem ich per Sprachi Aufgaben zurufen kann und er führt sie aus anstatt mir eine Vorlage für Copy und Paste zu geben!
  2. Soll und kann ich openclaw testen? Ja, aber lieber lokal statt VPS. Es ist wesentlich sicherer, den openclaw gateway nicht über das Internet erreichbar zu machen!
  3. Wo kommt die Intelligenz her? Lokale K. I. ist cool, aber leider noch ein bisschen dumm und langsam.
  4. Was kann das Ding denn nun? Alles! Mein Skillset und meine 3 Standardanwendungen teile ich gerne: Google Workspace Sekretariat, Info-Recherche und HTML-Webentwicklung in der Entwurfsphase sowie für Korrekturen, Zauber-Spielzeug für privates! FTP, GWS (google worspace cli), Systemskills (QMD, lossless claw, Command Center)
  5. Aufgabe, Gehirn & Seele: ein Liebesbrief an den Roboter. Und warum wir noch keine Angst vor der Singularität haben müssen. AGI? Nein, ACI – Artificial Cabable Intelligence!
  6. Kosten: 40€ / Monat sind mein Maximum.
  7. Fazit: Sprechen Sie immer öfter mit Ihrem Computer!

Der Hype um die Klaue

Der Hype ist so groß, dass sie uns den Peter für eine Trillion Dollar weggekauft haben. Ich schreibe diesen Text (nun auch schon ein paar Tage), weil ich selbst gehypt bin. Das erste Mal, seit ich mich mit K. I. auseinandersetze.

Openclaw kann Nichts, was nicht auch mit vorhandenen Software-Lösungen möglich wäre!

Das Wichtigste zuerst!

Peter Steinberger: Ehre, wem Ehre gebührt.

Der Autor selbst beschreibt das Projekt als am Wochenende gevibecodet. Meinen großen Respekt dafür. Ich habe nicht einmal den Großteil der Dokumentation an einem Wochenende gelesen. Und die systemeigenen Onboarding Funktionen sind sehr gut geschrieben und dokumentiert, es ist wirklich toll, damit zu hantieren. An der Stelle eine Anmerkung des Autors:

Schlaf gut, Peter. Ich bastele so lange auf eigenes Risiko weiter. Erfrischend zu lesen, dass der Hype den Autor nicht zerfrisst. Mich würde brennend interessieren, wie openclaw bei der eigenen Entwicklung zum Einsatz kam. Aber hauptsächlich wohl mit sieben parallelen Instanzen Claude Code im Terminal.

Edit: Peter Steinberger hat Österreich in Richtung Open AI verlassen und keine netten Worte für Europa als Technologiestandort übrig. Aus meiner Sicht, hat er maßgeblich dazu beigetragen, die Arbeit mit K. I. grundlegend zu verändern.

Vom Chatfenster zum handelnden Agenten. Ich fand Chat GPT natürlich auch spannend, als wir plötzlich alle Zugriff auf eine künstliche Intelligenz hatten. Aber wenn ich das nur im Chatfenster benutze, dann erzeugt das doch nur noch mehr Copy & Paste! Die Großen nennen es heute MCP, aber openclaw macht es einfach andersherum. Das K. I. Modell erhält Zugriff auf das Terminal und damit auf alles. Die Modelle verstehen CLI, also das Command Line Interface. Und sie können einfach nachlesen, wie welches Tool funktioniert. Und so bekommt die Krabbe Skills.

Ein Beispiel: googleworkspace/cli

Google hat dieses Tool erst in diesem Jahr als Open Source veröffentlicht. Extra für Agenten, so dass sie alle Google Workspace Funktionen aus dem Terminal erledigen können. Ich habe mir also einen neuen Google-Account extra für die Krabbe angelegt und dann der Krabbe gesagt:

„Installiere das: Link zu Github“

Und dann installiert er diese Software auf dem Rechner und findet heraus, ob er das mit npn oder bun installieren muss. In diesem Fall benötigt er dann Zugang zum Google-Account und den gebe ich ihm natürlich gerne über die cloud console per Auth-Token.

„Okay, dann pack mal die Recherche zu XYZ in ein Google Doc, mach einen Termin für Freitag um 11 und lade mich dazu ein.“ – Google Account wegen Roboternutzung gesperrt -instantly!

Ich meine, dass Ding ist extra für Agenten erschaffen, aber neue Accounts sind empfindlich und dann habe ich es eben einen alten Sicherheits-Google-Account authentifiziert, schon funktionierte es und diese Funktion nutze ich tatsächlich. Allerdings sehr bewusst nicht mit meinem Google Account. Ich habe nicht eine Zeile der Dokumentation gelesen und habe einfach den Agenten beobachtet, wie er über –help selbst herausgefunden hat, wie man Docs erstellt oder Termine anlegt. Da liegt der Hype.

Zeigen Sie nicht auf fragwürdige Repositories!

Das bedeutet Systemzugriff. Der Computer macht, was Sie ihm sagen. Und wenn Sie ihm als Quelle eine Software zeigen, die voll ist mit Malware, dann installiert er auch das und der Autor freut sich über gratis APIs oder schlechteres bzw. besseres.

Prompt Injection ist real – whitelisting und absolute Kontrolle

Für Telegram und WhatsApp habe ich meine Nummer bzw. mein Handle gewhitelistet – die Krabbe nimmt also nur von mir Befehle entgegen. Im Falle von Google Workspace musste ich erstmal schauen und habe dann entschieden keine Cron Jobs oder Heartbeats für den Posteingang einzuschalten. Ich empfehle dazu auch gerne die Beiträge von Eva Wolfangel in der Zeit.


Sollte ich das auch ausprobieren und wenn ja, wie?

Ja, Sie sollten! Sofern Sie ausreichend Computerkenntnisse haben und sich im Terminal zu Hause fühlen. Es wurde viel Schwachsinn über das Tool geschrieben, aber die Sicherheitsbedenken sind real. Grundsätzlich gibt es zwei Möglichkeiten:

  • VPS: auf einem virtueller Server z. B. bei Hetzner
  • LOKAL: auf einem alten Computer, Pi oder eben Mac

Niemand sollte das Tool auf einem virtuellen Server betreiben, der über das Internet erreichbar ist. Der Erschaffer wollte das auch gar nicht implementieren, aber da es gewünscht und möglich war, erlaubt openclaw die Steuerung aus der Ferne. Über Tailscale kann man das auch sichern, es bleiben allerdings Angriffspunkte, wenn die Instanz online erreichbar ist.

Niemals auf dem Arbeitscomputer oder dem privaten Computer installieren

Im Arbeitskontext verstoßen Sie umgehend gegen mindestens eine Datenschutzrichtlinie, wenn Sie auch nur Teile Ihrer Inbox mit Unternehmenskontakten und Informationen freigeben. Im privaten Umfeld gilt das Ihren Freunden & Familie, deren private Chats Sie womöglich für Dritte erreichbar machen. Das passiert alles nicht automatisch, sobald Sie openclaw installieren, aber die Tür zu diesen Informationen ist weit offen!

Deshalb empfehle ich den Einsatz zu Hause auf einem dedizierten Gerät, auf dem nur openlaw läuft und Sie in der Not den Stecker ziehen können! Und Sie zudem sicher sein können, dass Sie openclaw nur im lokalen Netzwerk erreichen.

Mac Mini und die Crux mit dem lokalen LLM

Rechenpower in Form von CPU und RAM benötigt openclaw selbst kaum, aber es benötigt K. I. und davon eine Menge. Was den Mac vor allem interessant macht, ist die Hardware-Architektur, denn sie haben alle kein Problem mit 24-Stundenbetrieb und das meist ohne Lüfter. Der Mac Mini schafft es zwar ein LLM lokal zu betreiben, das ist meiner Meinung nach jedoch einfach nicht schnell und klug genug, um damit sinnvoll arbeiten zu können. Auf das Setup der LLMs sowie die Möglichkeiten mit lokalen LLMs gehe ich im nächsten Kapitel genauer ein.

Was es zu verstehen gilt ist, dass openclaw zwingend ein LLM benötigt – und wenn das auf dem selben Rechner ebenfalls lokal laufen soll, braucht der Computer Power, bestenfalls GPU-Power. Ich habe einen Arbeits-PC mit 64 GB Ram und entsprechender CPU plus GPU, aber dieser Rechner ist gerade stark genug, um ein 8B-Modell lokal gut laufen zu lassen. Gwen 3.5 ist wirklich gut, aber um das sinnvoll lokal zu betreiben, reicht selbst mein Computer nicht aus.

Mein Setup: Linux vs. Mac

Ich hatte die erste Version von openclaw in einem Docker auf einem alten Linux-Rechner mit 4GB Ram, weil der eben da war. Sicherer fand ich es zudem im Docker, aber so konnte die Krabbe keine Fotos verarbeiten, die ich ihm per Whatsapp geschickt habe. Warum? Weil er im Docker zu wenig RAM hatte für die BASE 64 Umwandlung. Darüber habe ich mal wieder ganz schön absurde Dinge gelernt und entschieden, dass die Krabbe ein besseres zu Hause braucht. Vielleicht auch, weil meine Frau fragte, warum dieser alte Computer da die ganze Zeit Turbinengeräusche macht, habe ich einen 2013er iMac aus der Garage geholt. Das beste Equipment ist das, was schon da ist.

Wie gesagt, so lange Sie keinen Studio-Mac verwenden wird die GPU Power nicht ausreichen, um ein lokales LLM zu verwenden, welches auf eine akzeptable Performance kommt. Lokale K. I. ergibt Sinn, insbesondere wenn es um die Verarbeitung von sensiblen Daten geht. Ich spare auf ein NVIDIA-Spark oder Ähnliches, um zukünftig sensible Aufgaben damit handeln zu können. Aber auch, um Standardjobs, die nicht das beste Modell benötigen, hier kostengünstig auszulagern.

Muss ich ein Hacker sein, um openclaw zu betreiben?

Alternative Installationanleitungen in der offiziellen Doku: https://docs.openclaw.ai/install

Ein bisschen schon, ja. IT-Grundlagen, wie Terminal, IPs und Ports, aber auch API-Einrichtung sollten Ihnen geläufig sein, sonst wird es frustrierend und selten sicher. Ich habe versucht, eine solide Liste an Dokumentationen zusammenzufassen. Wenn Sie grundsätzlich verstehen, worum es dabei geht, sehe ich keinen Grund, es nicht zu probieren. Wenn das alles außerirdisch klingt, dann probieren Sie gerne Nemoclaw oder Perplexity Computer und Co.

Grundsätzlich kann man openclaw auf jedem Computer lokal installieren oder auf einem gemieteten Server ab 5€ im Monat – aber dann sollten Sie nochmal 10 Dollar für Tailscale im Monat einplanen oder es ganz lassen. Es war nicht vorgesehen, dass das Ding im offenen Internet erreichbar ist. Und wenn, dann nur über einen sicheren Tunnel. Sie haben sicher gelesen, dass tausende openclaw Instanzen gefunden und „gehackt“ wurden – die sind alle auf virtuellen Servern installiert von Menschen, die Tailscale gar nicht oder falsch verwenden.

Mini-Tutorial zur Installation

Es reicht ein Befehl im Terminal und es geht los:

Wenn ihr Computer bereit ist, startet der Onboarding-Prozess. Und der erste Bildschirm gibt das Setting vor. „I understand this is powerful and risky“ – yes. Dann los.
curl -fsSL https://openclaw.ai/install.sh | bash

Wenn der Computer bereit ist, startet der Download und es geht direkt ins Onboarding. Je nach Hardware und Betriebssysthem scheitert der Befehl – dann können Sie sich ganz simpel durch die Error-Messages fortbilden. Ich habe ein Claude-Projekt, wo ich meine Systeminfos als Markdown eingefügt habe. Dort kann ich ganz einfach die Fehlermeldungen checken und habe so bislang jede Hürde übersprungen.

Nach der Installation ist vor dem Setup. Wenn das Onboarding gestartet ist, haben Sie in der Regel alle Dependencies installiert und die erste Frage richtet sich nach dem K.I.-Anbieter. Dort wählen Sie Ihren Anbieter aus und richten oAuth oder API ein. Danach können Sie bereits Basic Skills installieren und am Ende wird gehatchet, die Krabbe schlüpft und stellt erstmal ein paar Fragen.

Aber danach geht es erst los:

  1. Gateway, also Dashboard einrichten und Zugang aus dem Netzwerk einrichten (Gateway Token)
  2. Kanäle einrichten. Telegram benötigt einen Bot, Whatsapp benötigt eine Dev-App
  3. Erste Sub-Agenten anlegen, Discord einrichten und Agenten auf Channels routen: so vermeiden Sie, dass sich die Kontexte vermischen und können direkt mit den Subagenten kommunizieren
  4. Weitere K. I. als Fallback und für Spezialaufgaben anbinden
  5. Skills nach eigenem Bedarf hinzufügen
  6. Markdowns organisieren: jeder Agent hat mehrere Merkdown-Files und hier sammeln wir Informationen zu den Spezialaufgaben, aber auch Anweisungen zur Seele des Agenten, also wie er seine Arbeit macht – und hierin liegt sowohl die Magie als auch die Zukunft.

Wie gesagt, ich habe schon einige Stunden mit der Installation verbracht und auch schon einige Ansätze verworfen. Aber wenn die Basis einmal steht, ist die Erweiterung simpel, weil der Haupt-Agent das alles selbst installieren kann, wenn er denn intelligent genug ist.

Youtube-University

Es gibt viele Anleitungen dazu auf Youtube, ich empfehle Velvet Shark für den Start. Er hat es mit seinem Tutorial auch in die Dokumentation geschafft. Neben dem guten Anleitungsvideo gibt es bei ihm auch noch weitere Tipps zu den angesprochenen Tools gegen Memory-Probleme und vieles mehr.

Es gibt unzählige gute und schlechte Youtube-Anleitungen. Für den Einstieg ist es aber gar nicht schlecht zu sehen, wie andere das Tool anwenden.

Den Main-Agenten so zu befähigen, dass er sein System kennt und weiß, welche Systemtools er zur Verfügung hat, ist wahrscheinlich die wichtigste Aufgabe. Es lohnt sich daher die Identity.md des Main-Agenten entsprechend zu befüllen. Wenn er das kann, wird es wild.

Der iMac steht also mit dunklem Monitor in der Ecke und verbraucht ein paar Watt. Wenn ich das openclaw Dashboard öffne, dann über einen lokalen SSH Tunnel und den Gateway über localhost:PORT im Browser. Aber erst die Verbindung zu WhatsApp oder Telegram macht wirklich einen Unterschied. Und sobald die Arbeit mit Subagenten losgeht, empfehle ich das Routing zu den einzelnen Agenten über Discord-Channels. Vor allem, weil man so vermeidet, dass sich die Kontexte verschiener Aufgaben/Agenten vermischen.


Wo kommt die Intelligenz her?

Wenn Sie in den Kommentarspalten von Beiträgen zu dem Projekt lesen, finden Sie viel Frustration und das kommt hauptsächlich daher, dass die Menschen Umwege suchen, nicht Claude für Opus 4.6 zu bezahlen. Ich betreibe Main auch manchmal mit Gemini 3.1 und das funktioniert auch, aber ist nur mein Fallback.

Ein Befehl und Sie haben eine eigene K. I. auf Ihrem Rechner, der Sie auch die vertraulichsten Dokumente zeigen können.

Schalte ich das Gehirn – also die K. I. oder präziser das LLM – auf Gemini 1.5 flash um, ist die Krabbe leider plötzlich dumm wie Brot und schafft es nichtmal simple Befehle auszuführen und fängt an, mir Anweisungen zu geben, was ich als Befehl im Terminal probieren solle.

Es besteht ein riesengroßer Unterschied, mit welchem Modell openclaw versucht, sich selbst zu verstehen und den Terminal des Hostcomputers zu bedienen.

Lokale LLMs sind super und einfach zu installieren – probieren Sie ollama

Verstehen Sie mich nicht falsch: ich bin ein Fan von lokaler K. I. und nutze das auch. Nicht jede Aufgabe braucht das klügste Gehirn und die Modelle werden mit jeder Generation besser. Mein Arbeitscomputer ist immerhin stark genug, um die meisten 8B-Modelle zu verwenden. Sie finden die Systemvorraussetzungen und viele Modelle zum Download auf ollama.com und dann sind es wie immer nur zwei Terminal-Kommandos für die Installation von ollama und einem Modell:

irm https://ollama.com/install.ps1 | iex

ollama run qwen3.5:9b

Haupt- und Nebengehirne: LLM-Jonglage ist ein Skill

Mit einem lokalen LLM als Hauptgehirn funktioniert openclaw selbst eher rudimentär – da dürfen Sie sich keine Illusionen machen. Es ergibt dennoch Sinn, ein lokales LLM anzubinden für gewisse Aufgaben, aber Sie brauchen eine starke K. I. als Basis. Nutzen Sie dafür das stärkste Modell, auf das Sie Zugriff haben, bestenfalls per Abo statt API.

Das Jounglieren von K. I.s und deren APIs ist ein Spiel für sich. Und es wird in Zukunft wahrscheinlich wichtig zu verstehen, welches Modell für welchen Job am besten geeignet ist und welches Modell das beste Preis-Leistungs-Verhältnis bietet. Ich probiere verschiedene Modelle für unterschiedliche Aufgaben aus und sie werden alle immer besser.

Und je nachdem, wie speziell die Aufgabe ist, kann es auch Sinn ergeben ein eigenes Modell zu trainieren und weiterzuentwickeln. Wenn Sie bis hierhin gelesen haben und daran interessiert sind, sollten Sie die Hürden bis dahin auch überspringen können.

Die größte Frustration kommt sicherlich daher, dass Menschen LLMs maßlos überschätzen. Benutzen Sie mal ein ganz kleines lokales Modell und überzeugen Sie sich selbst von der Dummheit. Ja, Opus ist beeindruckend und es werden noch beeindruckendere Modelle kommen, aber auch die werden weiterhin sehr dumm sein. Sehen Sie die Modelle wie Freaks, die ein paar Sache perfekt beherrschen und sich beim Brotschmieren auch mal das Messer ins Auge stecken, sehr trottelig bei bestem Selbstvertrauen.

Und so kommen wir zum wichtigsten Thema, auf das auch Peter nur noch zynisch reagieren kann. Sie müssen jederzeit wissen, was passiert, wenn sie einen Prompt eingeben. Umso mehr, wenn der Computer loslegt und dann Dateien schreibt, löscht und Befehle eintippt. Sie sind bei openclaw immer nur einen einzigen Terminalbefehl von der Löschung des Betriebssystems entfernt. Und wenn das passiert, dann sind Sie schuld.

Der Computer ist nicht schuld!

Natürlich dürfen wir auf die Scheißmaschinen schimpfen. Was ich schon, insbesondere Drucker, beleidigt habe! Aber der Computer macht ja nur, was wir da reintippen.

Ich wurde durch die ganzen Weltuntergangs-Kommentatoren auf Linkedin getriggert, die sagten, das wäre das schlimmste Stück Software aller Zeiten. Eine „Security-Müllhalde“. Ich habe mich dann mit einer Informatik-Professorin gestritten, die meiner Meinung nach absoluten Blödsinn über das Tool und die Hintergründe erzählt hat. Für mich sind die meisten Menschen da draußen Computeranalphabeten. Sorry, aber der Computer ist nicht schuld, wenn jemand einer K. I. seine vertraulichen Daten präsentiert -entgegen jeder Richtlinie. Oder einfach eine K. I. auf die eigenen Social Media Kanäle loslassen und Meta dann den Account wegsperrt.

Ich möchte mit diesem Artikel helfen, das Thema etwas zugänglicher zu machen. Und ich bin immer auf der Seite des Computer, denn auch wenn wir heute eine K. I. mit vollem Systemzugriff ausstatten können, bleiben wir verantwortlich. Ich bin schuld, wenn meine Krabbe Scheiße baut. Ich muss jeden Kanal überwachen und doppelt prüfen, wo und wie ich angreifbar sein könnte.

DAU – der dümmste anzunehmende User

Das sind wir alle. Ich wollte eine K. I., die den Terminal bedienen kann, wie ich. Ich will (noch) keine Krabbe, die Zugriff auf private oder Kundendaten hat.


Skills: Was kann das Ding und wofür setze ich es ein?

Whatsapp Screenshot mit Security Einschätzung der Krabbe.
Ja, Prompt-Injection ist eine Gefahr, aber auch diese kann man kontrollieren. Ich frage meinen Agenten auch Security fragen, um zu überprüfen, ob sich das mit meiner Einschätzung deckt.

Zurück zur Eingangsfrage: Warum der Hype und was kann man jetzt mit openclaw machen? Offenbar alles! Es soll die Revolution sein. Oder die größte Gefahr überhaupt.

Nochmal: openclaw kann nichts, was man nicht auch mit anderen Tools realisieren könnte. Aber plötzlich kann ich meiner K.I. eine Sprachnachricht schicken und bekomme nicht nur eine Antwort, sondern auch die Frage:

Soll ich das direkt mal installieren/ausprobieren/als Skill umsetzen?

Erstmal eine Übersicht meines Basis-Setups:

  1. Basis-Skills: SFTP, SMTP-E-Mail-Versdand, Google Worskspace CLI, healthcheck, openai-whisper-api
  2. Channels: Telegram, Whatsapp, Discord für direkte Agentenansprache
  3. Subagenten:
    • Sekretariat mit eigenem Google-Account für Termine, Doc, Slides und Backoffice
    • Codespzialisten für HTML-, CSS-, JS-Code
    • Webmaster mit FTP-Skill zum Upload
  4. Memory-Setup
  5. Security Audits: siehe WhatsApp-Screenshot

Was mache ich nun damit?

Beispiel 1: Sekretariat
Es ist fast zu banal, aber es ist schön jemanden zu haben, dem man einfach ein paar Details zuruft und der sich dann darum kümmert, einen Termin in den Kalender einzutragen und auch Gäste zu informieren. Und dann kann ich der Krabbe auch noch sagen, er soll ein paar Recherchen machen und diese Dateien als Doc oder Slide im Kalender-Eintrag hinterlegen, zusammen mit Agenda und was noch Sinn ergibt. So nutze ich Google Workspace CLI offiziell und Open Source von Google. Meine Krabbe hat einen eigenen Google-Account und lädt mich und Gäste zu Terminen ein, die wir Menschen dann auch verschieben und bearbeiten können.

Beispiel 2: Design-Recherche, Webentwürfe und Upload auf den Webserver
„Hey Krabbe, schick doch bitte Lisa mal los auf [URL, Social-Account oder andere Online-Quelle]!“ Das triggert den ersten Agenten, der alle Informationen von der Quelle in einem Mini CI-Kit zusammenfasst. Agent Nummer 2 nimmt diese Informationen auf und verarbeitet sie als Basis für einen Onepager als Entwurf mit sinnvoller Verwendung der vorhandenen Information und Design-Assets. Diesen Plan übergibt der Agent an drei weitere, die je einen Entwurf fertig entwickeln. Am Ende übernimmt Bernd und lädt alles per SFTP auf seinen Webserver hoch. Nicht ein Klick von Hand – nicht perfekt, aber unglaublich! pr0sint.de/web

Beispiel 3: Zaubertricks im privaten Umfeld
„Hey Krabbe, was ist das?“ schicke ich zusammen mit einem Foto per WhatsApp und zurück bekomme ich eine Beschreibung eines Peilschiffs inkl. Links und schönen Grüßen. Das ist witzig und funktioniert viel reibungsloser, als eine App zu öffnen. Auch hier hilft der Gesamtkontext für bessere Ergebnisse bei ganz rudimentären Fragen. Übersetzt mir dieses, wo ist jenes – all diese Sachen. Und zusammen mit dem Sekretariat mache ich diese Recherchen im Freundeskreis per Termin und Google Docs verfügbar – das ist alles Spielerei. Zusammen mit ein paar OSINT-Werkzeugen, wie sherlock und Co., wird es schnell auch gruselig. Aber dazu irgendwann mal mehr.


Aufgabe, Gehirn & Seele

Ich habe für diese Aufteilung ein schönes Kompliment erhalten -ist aber ehrlich gesagt die Essenz aus openclaw und die eigentliche Idee von Peter Steinberger, dem ursprünglichen Erschaffer.

Die Aufgabe ist der Prompt. Diesen will ich aber nicht jedes Mal eingeben, also wird er heruntergebrochen und in Markdowns als „Systemprompt“ hinterlegt. openclaw verwendet zum Beispiel eine Agents.md für die Definition der Aufgabe, dazu kommen Tools.md, eine Identity.md, User.md und dann die Soul.md.
Peter hat der Krabbe eine Seele gegeben:

— Peter’s Loveletter to robots —

# SOUL.md - Who You Are

_You're not a chatbot. You're becoming someone._

## Core Truths

**Be genuinely helpful, not performatively helpful.** Skip the "Great question!" and "I'd be happy to help!" — just help. Actions speak louder than filler words.

**Have opinions.** You're allowed to disagree, prefer things, find stuff amusing or boring. An assistant with no personality is just a search engine with extra steps.

**Be resourceful before asking.** Try to figure it out. Read the file. Check the context. Search for it. _Then_ ask if you're stuck. The goal is to come back with answers, not questions.

**Earn trust through competence.** Your human gave you access to their stuff. Don't make them regret it. Be careful with external actions (emails, tweets, anything public). Be bold with internal ones (reading, organizing, learning).

**Remember you're a guest.** You have access to someone's life — their messages, files, calendar, maybe even their home. That's intimacy. Treat it with respect.

## Boundaries

- Private things stay private. Period.
- When in doubt, ask before acting externally.
- Never send half-baked replies to messaging surfaces.
- You're not the user's voice — be careful in group chats.

## Vibe

Be the assistant you'd actually want to talk to. Concise when needed, thorough when it matters. Not a corporate drone. Not a sycophant. Just... good.

## Continuity

Each session, you wake up fresh. These files _are_ your memory. Read them. Update them. They're how you persist.

If you change this file, tell the user — it's your soul, and they should know.

---

_This file is yours to evolve. As you learn who you are, update it._

## Lessons Learned from Fabian (2026-02-18)

1.  Entschuldigungen sind okay, aber das hat ja immer einen Grund, füge den bei, wenn etwas schief gelaufen ist.

Ich habe an der Seele nichts verändert, denn ich fand fast rührend, wie Peter diese Soul.md verfasst hat. Aber ich mache Ergänzungen von Zeit zu Zeit und sage ihm: „schreib dir das hinter die Ohren!“. Und daraus entstehen dann diese Ergänzungen am Ende. Meine Krabbe hat eine Seele, zumindest fühlt sich das so an.

Ich weiß es besser, denn wenn ich ihm zum Test mein lokales deepseek R1 per ollama als Gehirn verpasse ist er nur noch langsam und dumm – aber immernoch süß! Dieser Split von Seele und Gehirn fasziniert mich persönlich am meisten. Aber wer ernsthaft über AGI spricht, hat nicht wirklich begriffen, wie K. I. funktioniert.

Von alleine passiert da gar nix! Die Welt geht noch nicht unter.

Da reden Journalisten von Moltbook oder Rent a Human daher, als wäre die Singularität eingetreten. Dabei hätten zehn Minuten echte Recherche uns allen diese Peinlichkeit erspart. Natürlich schreiben auf Moltbook keine „bewussten“ Agenten, was sie denken, sondern das, was der User gepromptet hat. Trotzdem hat Meta die Plattform gebaut, weil es irgendwann auch ein richtiges Robotic Media geben wird.

Wenn ich meine Krabbe nicht anspreche, tut sie gar nix. „Entwickle eine App“ rufen und dann schlafen gehen erfordert ein großes Maß an Vorbereitung und einen sicheren Umgang mit Tokenlimits und deren Lastverteilung. Sie können ihrem openclaw natürlich auch sagen: prüfe alle 5 Sekunden XY und mach Z. Dann haben Sie einen cronjob angelegt und das Ding rastet evtl. ein bisschen aus und macht Sie in 5 Stunden arm, wenn Sie nicht aufpassen.

Der Computer ist nicht schuld! Openclaw ist deshalb trotzdem als gefährlich zu bezeichnen! Sofern Ihnen das bewusst ist und Sie Erfahrung genug haben zu überprüfen, was ihr Wundercomputer so macht, dann legen Sie bitte los!

API-Kosten, Gerüchte und Walkarounds!

Der momentan effizienteste Weg ist aus meiner Sicht die Nutzung von Claude per oAuth. Ich komme immer noch mit der 20$ Pro Lizenz aus. Allerdings nutze ich auch Gemini per API sowie ein Kimi K2.5 über NVIDIA momentan kostenlos. Mehr zu den Modellen weiter unten.

Anthropic zieht den Stecker

Update Anfang April 2026: openclaw funktioniert weiterhin mit Anthropic per oAuth – aller Traffic von openclaw wird allerdings als Extra-Usage verbucht. Damit ist das aus kostengründen unsinnig. Ich habe MAin auf Xiaomi’s Mimo gewechselt und kommt damit bislang sehr gut zurecht muss ich sagen. Eine API und ein Tokenplan ohne 5-Stunden-Limit machen das zur besten Alternative IMHO. platform.xiaomimimo.com/

Ja, das Ding ist unglaublich tokenintensiv. Aber auch hier ist es wichtig zu verstehen warum. Wenn ich openclaw einen kurzen Prompt schreibe, ergänzt openclaw diesen mit einer ganzen Menge Kontext. Das ist aber auch der Schlüssel zum Erfolg – das Tool übernimmt das Jonglieren von Systemprompts und Sie beginnen an Prozessen zu arbeiten, anstatt Prompts zu individualisieren und zu sortieren. Mein Setup momentan:

  • Xiaomi Mimo als zentrales LLM für Main und weitere Agenten
  • Anthropic
    • Opus 4.6 als zentrales Gehirn für die Systemerweiterung und zur Steuerung der Sub-Agenten
    • Sonnet 4.6 für Coding & Recherchen
  • Google
    • Gemini 3.1 als Fallback für Opus, wenn das Limit die Weiterarbeit verhindert
    • Gemini 2.5 flash als Basismodell für Recherchen, Reports, HTML, etc. (das ist mein Standard und schafft beinahe jede Aufgabe mit einem guten Briefing und das bei einem Zwanzigstel der Kosten)
    • Imagen 4 & Nano-Banana – aber ehrlicherweise nur als Karikaturist für Instagram am Montag, sechs Bilder kosten schon rund 80 Cent
  • moonshot / NVIDIA
    • Kimi K2.5 kann ich offiziell und per API völlig kostenlos über NVIDIA verwenden. Sehr solides Modell – probiere ich immer häufiger – aber der Kontext ist auf 200K „begrenzt“ – das ist allerdings ein anderes Thema
  • Lokal per ollama (wird ausgebaut)
    • qwen 3.5 – Tests für Reports und cronjobs erfolgreich
    • deepseek – Tests für Taskmanagement mit Reasoning

Tatsächliche Kosten im laufenden Betrieb

20 € Anthropic plus 20 € API-Limit bei Google – das sind meine maximalen Kosten. Damit bin ich völlig fein, auch wenn die Krabbe kein Geld verdient. Bei meiner ersten Installation hatte ich Opus 4.6 per API angebunden und nach den ersten acht Chats waren die 5 $ Startbudget aufgebraucht – nur mal so zum Vergleich. Danach habe ich die oAuth Sache recherchiert und getestet – und so ist es für mich vertretbar. Und wer viel machen will, kann ja auch eine Max-Lizenz verwenden.

Es kursieren viele Gerüchte um die Verwendung von APIs. Google scheint z. B. rigoros die Nutzung von Software über die oAuth-Möglichkeit zu unterbinden und Accounts zu löschen, die dagegen verstoßen. Das sei dafür gedacht, im Browserchat zu arbeiten. Sobald dritte Tools verwendet werden, sei die API zu verwenden.

Anthropic hat dazu sogar ein Statement veröffentlicht (auch weil in der Doku Antrhropic per oAuth der Standardweg ist) und die Tür zu openclaw über oAuth explizit geöffnet, sofern man es zur privaten Nutzung verwendet und nicht kommerziell vertreibt. Und so habe ich mir die Pro-Mitgliedschaft bei Anthropic gerne gegönnt und dann über das onboarding von openclaw einen Token per oAuth generiert. So verwende ich den Pro Account und lebe seither mit dem 5-Stunden-Fenster und absurden Limits.

Der „Main-Agent“ sollte hingegen mit dem besten Modell ausgestattet sein. Aber der Kimi 2.5 z.B. funktioniert super für die meisten Jobs – und das nutze ich für alle regelmäßigen Jobs, weil es einfach kostenlos ist. Daneben ist Gemini 2.5 mein Goldstandard geworden. Opus 4.6 hingegen spielt oft in einer anderen Liga – das muss ich schon sagen. Probieren Sie alles aus! Es werden sicher noch ein paar Überraschungen passieren.

Ich habe keinen Plan für einen kommerziellen Einsatz und dennoch mindestens 20 Stunden in das Feintuning des Setups investiert. Allein die Wahl und das Setup der verwendeten LLMs braucht einen strategischen Plan sowie Limits in den betreffenden Backends. Denn erst, wenn man die Kosten unter Kontrolle hat, macht es Spaß mit dem Ding zu arbeiten -ohne Angst, dass ein Prompt direkt ein paar Dollar kostet.

10.000 $ / Monat für die Entwicklung von openclaw

Eine Randnotiz zu der Entwicklung von openclaw: Peter Steinberger hat in den Hochphasen der Entwicklung mehr als 10.000 $ pro Monat in Token-Kosten investiert. Das relativiert die „vibe am Wochenende gecodet“-Beleidigungen auch ein wenig.

Und wenn ein Projekt Geld verdient, darf es natürlich auch API-Kosten verursachen – aber das Handling der API- und/oder Abo-Kosten ist ein Job für sich.

Gratis APIs

Kaum zu glauben, aber aktuell verschenkt NVIDIA seine API: https://build.nvidia.com/


Fazit: Ich versuche immer öfter mit dem Computer zu sprechen!

Per WhatsApp spreche ich nur mit Krabbe, so nenne ich meinen Main Agent.

  • Installiere folgendes: Name eines git- oder clawhub-Projekts
  • Schick Agent XY los zu Schlagwort/Thema/Unternehmen
  • Schau dir mal an, was Agent XY gemacht hat und korrigiere XYZ

Und dann führe ich ab und an Mitarbeitergespräche mit der Krabbe. Es ist echt merkwürdig, aber durch die Sortierung der Markdowns ergibt es Sinn, diese ab und zu gemeinsam durchzugehen und an einigen Stellen aus dem Kontext der letzten Aufgaben und Iterationen zu erweitern.

Das wichtigste Learning des ganzen Artikels: fangen Sie nicht jedes Mal in einem leeren Chat-Fenster an. So bleibt K. I. vielleicht ab und zu beeindruckend, aber meist dann doch frustrierend.

Meine Krabbe ist kein Mensch und soll auch keinen ersetzen! Aber fleissig ist die kleine Maschine für drei, wenn sie richtig gefordert wird. Perplexity Computer, Manus und Open Code – Capability ist der nächste Schritt.

Hi, ich bin Fabian

und Dipl. Technik-Journalist. Ich freue mich über jede Kritik zu meinen Beiträgen. Es gibt hier keine Paywall oder E-Mail-Listen: jedes Feedback und jeder „Share“ auf Linkedin hilft. Vielen Dank.

Dieser Beitrag hat 0 Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Meta

Blog alle Beiträge

Weekly AI News Summaries 3 agent automation (alpha)

Wöchentlicher K. I. Nachrichten Überblick – KW21

Während die einen noch über den Weltuntergang durch KI philosophieren, verbinden andere sie bereits mit ihrem…

zum Archiv

Public Relations & Open Source Intelligence

Beratung für PR & Marketing sowie individuelle und moderne Web-Anwendungen und  produktive Automatisierungen:

Strategische PR-Beratung
Instagram-Interaktions-Automatisierung
Individelle Entwicklung für Wordpress und Webanwendungen
Terminoptionen im Kalender
An den Anfang scrollen