Wenn du KI für Aufgaben einsetzt, in denen du selbst kein Experte bist, bekommst du meist mittelmäßige Ergebnisse — dabei gibt es einen klaren Drei-Schritte-Prozess, um das zu ändern. Die meisten haben einen funktionierenden Workflow, wenn es darum geht, KI die Dinge beizubringen, die sie selbst verstehen: eine Skill schreiben, die eigene Expertise destillieren, das Modell ausführen lassen. Dieser Ansatz (oft als ACDC bezeichnet) funktioniert hervorragend, wenn du weißt, wie “gut” aussieht. Aber sobald du etwas delegieren willst, das du selbst nicht kannst — Design, Copywriting, Code in einer Sprache, die du nie angefasst hast — bricht das ganze System zusammen. Generische Prompts produzieren generische Outputs, und du hast keinen Geschmack, um gegenzusteuern. Dieser Artikel zeigt den Prozess, auf den ich gestoßen bin, um KI schwierige Dinge beizubringen — die Dinge, die du nicht einfach per ACDC lösen kannst.
Warum kannst du KI nicht einfach sagen “Mach’s gut”?
Wenn du KI bittest, “etwas Cooles zu erstellen” in einem Bereich, den du nicht verstehst, bekommst du genau das: etwas Generisches.
Ich habe das beim Versuch gelernt, Visuals mit Higgsfield zu generieren — eine KI-Medienplattform, die dir Zugang zu einem vollständigen Stack aus Bild- und Videomodellen bietet. Das Tool ist unglaublich leistungsfähig. Meine Prompts? Nicht so sehr. “Visualisiere das Konzept des menschlichen Context Windows” produzierte drei völlig unterschiedliche Outputs — alle klar als KI-generiert erkennbar, keiner davon brauchbar.
Das Problem war nicht Higgsfield. Das war ich. Ich habe nicht das Vokabular eines Designers. Ich kann einen Stil, eine Stimmung oder eine Komposition nicht mit der Präzision beschreiben, die nötig ist, um das Modell zu steuern. Und wenn du KI etwas beibringen willst, in dem du schlecht bist, läufst du gegen dieselbe Wand — egal ob Design, Finanzmodellierung, Videobearbeitung oder irgendetwas anderes außerhalb deiner Kompetenzzone.
Pro-Tipp: Wenn du nicht in eigenen Worten beschreiben kannst, wie “gut” aussieht, bringt dich kein Prompt-Engineering weiter. Die Lösung liegt vor dem Prompt.

Was ist der Drei-Schritte-Prozess, um KI schwierige Dinge beizubringen?
Der Prozess gliedert sich in drei Phasen: Research, Grilling, Assembly. Jede läuft in einer eigenen KI-Session, jede produziert ein Artefakt, und jede füttert die nächste.
Das Ziel: Systematisch den Kontext und den Geschmack aufzubauen, den du noch nicht hast — und ihn dann in eine Skill zu verpacken, die du immer wieder ausführen kannst.
So sieht die Struktur aus:
- Research — Schicke KI aus, um das Feld zu erkunden und zu sammeln, was die Community bereits weiß
- Grilling — Nutze KI, um dich zu deinen Präferenzen zu befragen und deinen Geschmack zu enthüllen
- Assembly — Verwandle den kombinierten Output in eine wiederverwendbare Skill mit austauschbaren Style-Guides
Jede Phase produziert ein Dokument. Die Skill am Ende ist das Compound-Asset.

Wie funktioniert der Research-Schritt?
Research bedeutet, KI auszuschicken, um herauszufinden, was andere in dem Bereich bereits tun, den du lernen möchtest. Du bist wahrscheinlich nicht die erste Person, die das angeht — Designer, Copywriter, Marketer und Entwicklende haben das alles schon durchgearbeitet, und vieles davon ist Open Source.
Gib KI ein klares Briefing: “Finde die besten Community-Skills, GitHub-Repos und Referenzmaterialien für [deine Domain]. Zieh alles heraus, was praktisch ist.” Weise sie auf Quellen hin wie die OpenClaw-Skill-Library, GitHub und die offiziellen Docs des Tools, das du nutzen möchtest.
Es gibt zwei Winkel, die du abdecken musst:
- Welche KI-spezifischen Ansätze existieren — Prompt-Muster, Skills, Workflows, die andere gebaut haben
- Domain-Vokabular, das dir fehlt — die tatsächliche Sprache, die im Feld verwendet wird, mit Beispielen
Für mein Icon-Projekt brauchte ich beides. Ich wollte sehen, wie andere Design-Skills strukturieren, und ich brauchte jemanden, der mir den Unterschied zwischen flachen, isometrischen und skeuomorphen Stilen erklärt, damit ich überhaupt eine Meinung bilden konnte.
Der Output ist ein Research-Report. Lies ihn, aber mach dir nichts daraus — er ist Rohmaterial für den nächsten Schritt.
Was ist der Grilling-Schritt und warum ist er wichtig?
Grilling ist der Moment, in dem KI die Rollen tauscht und dir die Fragen stellt. Die Idee, ursprünglich von Matt Pollock in einer Community-GitHub-Skill dokumentiert, ist folgende: Sobald du einen Research-Report auf dem Tisch hast, ist der schnellste Weg, deinen eigenen Geschmack zu extrahieren, sich befragen zu lassen.
Starte eine neue KI-Session — keine Fortsetzung der Research-Session. Lade die Grilling-Skill und das Research-Artefakt. KI wird anfangen, Fragen zu stellen wie: “Bevorzugst du diesen Stil oder jenen?”, “Wie würdest du das Vibe beschreiben, das du suchst?”, “Welches dieser Referenzbeispiele spricht dich tatsächlich an?”
Der Grund, warum das funktioniert: Du weißt nicht abstrakt, was du willst, aber du kannst es erkennen, wenn du es siehst. Grilling erzwingt Entscheidungen, und Entscheidungen enthüllen Präferenzen, die du nicht von selbst hättest artikulieren können.
Pro-Tipp: Nutze hier Spracheingabe. Gesprochene Antworten transportieren die Nuancen, die KI braucht. Getippte Stichpunkte streichen genau den Kontext, der das Grilling wertvoll macht.
Ein kurzer Hinweis, warum das eine neue Session und keine Fortsetzung ist: Research und Grilling getrennt zu halten, verhindert, dass das Context Window aufgebläht wird, hält KI auf eine Aufgabe fokussiert und verbraucht weniger Tokens. Jede Phase schließt mit einem externen Artefakt — dann startest du frisch neu.
Wie assemblierst du alles zu einer wiederverwendbaren Skill?
Assembly ist der Moment, in dem du den Research-Report und die Grilling-Outputs nimmst und KI bittest, sie zu einer wiederverwendbaren Skill zu komprimieren. Das ist der Compounding-Moment — alles, was du in den letzten zwei Sessions gelernt hast, wird zu einem Tool, das du auf Abruf ausführen kannst.
Die Struktur, auf die ich bei Creative-Asset-Skills lande, sieht so aus:
- Die Skill selbst — eine stehende Instruktion, die den Prozess erklärt, dem KI folgen soll
- Ein oder mehrere Style-Guides — separate Referenzdokumente, die verschiedene Ästhetiken beschreiben
- Ein Prompt-Template — für die tatsächliche Generierung der Assets
- Ein Handoff-Abschnitt — für das nächste Tool in der Kette (in meinem Fall Higgsfield)
Der Grund, Skill und Style-Guide zu trennen: Die Skill baust du nur einmal, aber du kannst mehrere Style-Guides für verschiedene Brand-Identitäten, Projekte oder Stimmungen entwickeln. “Generiere ein Icon in diesem Stil” oder “Generiere ein Icon in jenem Stil” — dieselbe Skill, unterschiedliche Referenz geladen.

Wie sieht das in der Praxis mit Claude und Higgsfield aus?
In der Praxis führst du den gesamten Flow in einer KI-Arbeitsumgebung aus, in der die richtigen Tools verbunden sind. Ich nutze Claude Cowork, aber derselbe Ansatz funktioniert mit Codex, Cursor oder jedem anderen Tool, das lokale Dateien lesen und MCP-Server aufrufen kann.
Das Setup braucht drei Dinge:
- Einen Projektordner mit deinen drei Prozess-Skills (Research, Grilling, Assembly)
- Einen MCP-Connector zu deinem Generierungstool — für Visuals stellt Higgsfield seinen gesamten Modell-Stack über
mcp.higgsfield.aibereit - Spracheingabe aktiviert — das einzelne größte Upgrade, das du deinem KI-Workflow geben kannst
Sobald das steht, läuft die gesamte Pipeline über Chat. KI liest deine Skills, orchestriert die Generierungstools, und du bleibst in einem Fenster.
Warum du bei jedem Schritt in Dreiern generieren solltest
Für kreative Arbeit: Generiere bei jedem Entscheidungspunkt drei Optionen. Das Muster: drei Konzepte, drei Renderings, drei Animationen.
Wenn du KI um einen Output bittest, hast du nichts zum Vergleichen. Wenn du um drei bittest, siehst du, welche Richtung deiner Vorstellung am nächsten ist — auch wenn keiner auf Anhieb perfekt ist. Subtile Änderungen im Prompt produzieren spürbar unterschiedliche Ergebnisse, und nur das Nebeneinander-Sehen baut das Gespür dafür auf, was funktioniert.
Der Flow:
- Brainstorme drei Konzepte für das Asset (z.B. drei Wege, “Real-Time-Sync” zu visualisieren)
- Wähle das, das deiner Vision am nächsten ist
- Generiere drei Still-Versionen dieses Konzepts durch Higgsfield
- Wähle den besten Still
- Generiere drei animierte Versionen aus diesem Still
Warum du immer mit einem Still beginnen solltest
Direkt von Prompt zu animiertem Video zu gehen, produziert seltsame, glitchige Ergebnisse. Animationen funktionieren am besten, wenn sie auf einem stabilen Standbild aufgebaut sind.
Generiere zuerst den Still, bringe ihn zur Perfektion, dann animiere daraus. Das gilt unabhängig davon, ob du Higgsfield, Runway oder ein anderes Videomodell nutzt — das Modell hat es deutlich einfacher, wenn es ein klares Startbild hat, von dem es ausgehen kann.
Wann verwendest du das vs. ACDC?
Die beiden Ansätze lösen unterschiedliche Probleme. ACDC funktioniert, wenn du die Sache bereits kannst und deine Expertise in eine Skill komprimieren willst. Research–Grilling–Assembly funktioniert, wenn du die Sache nicht kannst und die Expertise erst aufbauen musst.
| Ansatz | Am besten für | Dein Ausgangspunkt | Inputs | Output | Zeitinvestition |
|---|---|---|---|---|---|
| ACDC | Dinge, in denen du bereits gut bist | Du hast die Expertise; KI nicht | Dein Wissen, destilliert | Eine Skill, die deinen Prozess spiegelt | Eine fokussierte Session |
| Research – Grilling – Assembly | Dinge, in denen du nicht gut bist | Dir fehlt Vokabular, Geschmack oder Prozess | Community-Wissen plus deine Präferenzen | Eine Skill plus wiederverwendbare Style-Guides | Drei Sessions, dann laufende Verfeinerung |
Warum jede Skill ein lebendes Dokument sein sollte
Der erste Durchlauf einer neuen Skill wird nicht perfekt sein — und das ist der Punkt. Behandle die Skill als lebendes Dokument, das mit jeder Nutzung besser wird.
Gib KI nach jedem Durchlauf Feedback. “Diese drei Icons sind zu flach geworden.” “Der Animations-Prompt hat immer wieder Safety-Filter ausgelöst.” “Seedance 2.0 erzwingt 16:9, auch wenn ich 1:1 verlange.” Dann lass KI die Skill mit dem aktualisieren, was sie gerade gelernt hat.
Manche Teams führen eine separate “Learning-Stock”-Datei im Skill-Ordner — ein laufendes Log der Verfeinerungen. Mit der Zeit wird die Skill spezifisch für deinen Geschmack, deine Tools und deine Eigenheiten.
Pro-Tipp: Frag KI am Ende jeder Session: “Leite aus den Outputs, die mir gefallen haben, Prinzipien ab. Was können wir zur Skill hinzufügen?” Das ist die Compounding-Loop. Ohne sie startet jeder Durchlauf bei null.
Das große Bild
KI dazu zu bringen, deine Stärken zu verstärken, ist der naheliegende Schachzug. KI dazu zu bringen, deine Schwächen zu füllen, ist der Bereich, in dem echtes Wachstum passiert — weil du dort bisher eine harte Decke hattest.
Meistens ist die Antwort nicht “einen Designer finden”, “eine Copywriterin einstellen” oder “ein neues Handwerk von Grund auf lernen.” Es ist “das System aufbauen, das KI in deinem Namen damit umgeht.” Research–Grilling–Assembly ist ein Weg, dieses System aufzubauen. Es ist einfach. Es ist nicht immer leicht. Aber es ist es wert.
Häufig gestellte Fragen
Funktioniert das mit Notion AI, oder nur mit Claude und Codex?
Ja — der Prozess ist tool-agnostisch. Research, Grilling und Assembly drehen sich darum, wie du die Arbeit strukturierst, nicht welche KI du nutzt. Notion AI, Claude, Codex, ChatGPT oder jeder andere fähige Assistent kann alle drei Schritte ausführen, solange er deine Skill-Dateien lesen und — für die praktische Demo — die Generierungstools aufrufen kann, die du verbunden hast.
Wie unterscheidet sich das von ACDC?
ACDC setzt voraus, dass du die Expertise bereits hast und KI nur lehren musst, deinen Prozess zu replizieren. Research–Grilling–Assembly ist für die entgegengesetzte Situation — wenn du die Expertise nicht hast und sie erst aufbauen musst (oder aus der Community borgen), bevor du eine sinnvolle Skill schreiben kannst. Die beiden ergänzen sich, stehen nicht in Konkurrenz.
Warum eine neue Session für jeden Schritt?
Drei Gründe: Kosten, Fokus und Qualität. Jede Nachricht in einem langen Thread sendet die gesamte vorherige Geschichte erneut, sodass der Token-Verbrauch exponentiell wächst. Ein aufgeblähtes Context Window macht KI auch schlechter bei der aktuellen Aufgabe, weil mehr Rauschen gefiltert werden muss. Frisch zu starten nach jedem Schritt hält die Arbeit sauber und die Rechnung überschaubar.
Brauche ich wirklich Spracheingabe?
Du brauchst sie nicht, aber sie ist das größte Upgrade für den Grilling-Schritt. Gesprochene Antworten transportieren die Qualifikatoren, Zögerlichkeiten und Abschweifungen, die deine tatsächlichen Präferenzen enthüllen. Getippte Antworten sind tendenziell kurz und ohne Nuancen — genau das, was du nicht willst, wenn das Ziel ist, deinen Geschmack zu extrahieren.
Was passiert, wenn der erste Durchlauf meiner Skill schlechte Ergebnisse produziert?
Erwarte es. Der erste Durchlauf ist diagnostisch, nicht final. Notiere, was nicht funktioniert hat, lass KI eine weitere Grilling-Runde gegen die neuen Outputs durchführen, und aktualisiere die Skill. Nach zwei oder drei Iterationen hast du etwas, das zuverlässig gute Ergebnisse produziert — und eine Skill, die deinen Geschmack wirklich widerspiegelt statt einer generischen Baseline.
📬 Willst du mehr Notion-KI-Strategien? Schließ dich 37.000+ Lesenden an und erhalte sofort 42 kostenlose Templates → Newsletter abonnieren
💼 Brauchst du die Unterstützung zertifizierter Notion-Berater? Mein Team und ich helfen dir! → https://matthiasfrank.de/en/notion-consulting/



