Content erstellen – und ihn direkt an einer echten Zielgruppe testen, aus deinem Agenten heraus

Wir launchen die neuroflash-API und den MCP-Server als eigenständige Developer-Produkte. Hier steht, was drinsteckt, warum wir MCP-nativ gebaut haben und wie du startest.

Donald Vlahovic

21 Jun 2026 — 5 min read

Read in English →

Wir launchen die neuroflash-API und den MCP-Server als eigenständige Developer-Produkte. Hier steht, was drinsteckt, warum wir MCP-nativ gebaut haben und wie du in fünf Minuten startest.

Die meisten KI-Tools hören beim Generieren auf. Du promptest, bekommst Text – und schickst ihn auf gut Glück raus. Der teure Teil, nämlich herauszufinden, ob deine Zielgruppe darauf überhaupt anspringt, passiert später: in der Produktion, nachdem das Budget längst ausgegeben ist.

neuroflash wurde gebaut, um genau diese Lücke zu schließen: Content generieren und ihn an einer echten Zielgruppe validieren, bevor er live geht. Ab heute ist dieser Loop programmierbar. Die neuroflash-API und der MCP-Server sind jetzt eigenständige Produkte – keine Funktionen, die in der App vergraben sind, sondern eine Developer-Oberfläche, auf der du aufbauen kannst, mit eigener Doku, eigenem Onboarding und eigenem Pricing.

Dieser Beitrag erklärt, warum wir sie als Produkte ausliefern, was tatsächlich drinsteckt, wie der MCP-Server aufgebaut ist und wie du dich in wenigen Minuten verbindest.

Warum eine API und ein MCP-Server – als Produkte

Zwei Entwicklungen haben das vorangetrieben.

Erstens ist Integration heute Pflicht, nicht Kür. Die State-of-the-API-Daten der letzten Jahre sind eindeutig: Die überwältigende Mehrheit der Unternehmen ist API-first, und ein großer, wachsender Anteil behandelt seine APIs als eigenständige, umsatzrelevante Produkte. Eine Fähigkeit, die sich nicht aus dem eigenen Stack heraus aufrufen lässt, zählt zunehmend nicht. Deshalb ist die neuroflash-API ein erstklassiges Produkt: dokumentiert, versioniert und auf Integration ausgelegt – nicht nur auf eine Demo.

Zweitens wird MCP zur Standard-Art, wie Agenten Tools erreichen. Das Model Context Protocol gibt jedem MCP-fähigen Client – Claude, Cursor und einer wachsenden Liste weiterer – eine einheitliche Möglichkeit, externe Fähigkeiten zu entdecken und aufzurufen. Ein MCP-Server bedeutet, dass neuroflash dort auftaucht, wo Entwickler:innen ohnehin arbeiten – ganz ohne maßgeschneiderten Glue-Code. Wir wollten nicht, dass das ein nachträglicher Wrapper um die API ist; wir wollten ein Produkt mit eigenen Designentscheidungen. Darum geht es im Rest dieses Beitrags.

Was drinsteckt

Der MCP-Server umfasst 7 API-Domains:

Digital Twins – frage KI-Repräsentationen echter Zielgruppensegmente.
Brand Voices – erstelle, importiere und wende deinen markenkonformen Ton an.
Content-Generierung – Texte in deiner Brand Voice, für jeden Kanal.
Bildgenerierung – markenkonforme Visuals direkt im Workflow.
Zielgruppen, Usage/Quota und Workspaces – die unterstützende Oberfläche.

Das Unterscheidungsmerkmal sind die Digital Twins. Es sind keine LLM-Personas, die aus einem Prompt improvisiert werden – sie basieren auf über einer Million echter Befragungsprofile, gesammelt seit 2017, mit bis zu 255 Datenpunkten pro Person, und in unseren Tests bilden sie echte menschliche Antworten mit 85–98 % Genauigkeit ab. Das heißt: Ein Agent kann etwas wirklich Neues tun – eine Überschrift, eine E-Mail-Betreffzeile oder eine Anzeige entwerfen und dann das Zielsegment fragen, was es davon hält – in Sekunden, ohne das Gespräch zu verlassen.

In der Praxis sieht der Ablauf so aus: generate_text mit einer brand_voice_id, um markenkonformen Text zu erzeugen, dann chat_with_twin (oder chat_with_twin_group), um segmentspezifisches Feedback einzuholen, dann iterieren. Erstellen und validieren – an einem Ort.

Der Create-and-Validate-Loop: markenkonformen Content erzeugen, an einem Digital Twin testen, verfeinern und erst dann veröffentlichen.

Der Loop, der neuroflash auszeichnet: Generierung und Validierung in einem einzigen Workflow.

Wie der MCP-Server gebaut ist

Ein paar bewusste Architektur-Entscheidungen.

Remote, nicht lokal. Der Server läuft als Remote-HTTP-Server über Streamable-HTTP-Transport – es gibt nichts zu installieren oder lokal zu betreiben. Du richtest deinen Client auf eine URL:

https://app.neuroflash.com/api/mcp-server/v1/mcp

OAuth 2.0 mit PKCE. Die Authentifizierung ist ein browserbasiertes Login mit deinem neuroflash-Account – keine API-Keys, die du in Config-Dateien einfügst, keine langlebigen Secrets auf der Platte. Dein Client wickelt den Flow ab; der Server sieht nur ein scoped Token.

Architektur: Ein MCP-Client wie Claude oder Cursor authentifiziert sich via OAuth 2.0 mit PKCE und erreicht die sieben neuroflash-Service-Domains über den MCP-Server.

Eine URL, ein OAuth-Login – der MCP-Server verteilt auf jede neuroflash-Domain.

Drei Interaction Modes. Das ist der Teil, auf den wir am stolzesten sind. Derselbe Server kann seine Oberfläche auf drei Arten präsentieren, und das LLM wählt den besten Ansatz für die jeweilige Frage:

Traditional – ein Tool pro Endpoint. Ideal für einzelne, spezifische Operationen wie „liste meine Brand Voices".
Plan – statt einen Call nach dem anderen zu chatten, übermittelt das LLM einen einzigen typisierten JSON-Plan, den der Server serverseitig ausführt: sequenzielle und parallele Calls, Transforms, Branching, begrenzte Loops. Keine Round-Trips pro Schritt, kein Sandbox-Boot. Für mehrstufige Workflows braucht das rund 80 % weniger Tokens als der direkte Tool-Aufruf.
Exploratory – ein discover → query → compare-Flow für offene Fragen, bei dem sich das Modell schrittweise durch die API-Oberfläche bewegt.

Die drei Interaction Modes nebeneinander: Traditional ruft ein Tool pro Endpoint auf; Plan übermittelt einen typisierten JSON-Plan, der serverseitig ausgeführt wird; Exploratory erschließt die API mit discover, query und compare.

Derselbe Server, drei Oberflächen – das Modell wählt die effizienteste für die Aufgabe.

Ein minimaler Plan-Mode-Payload – alle Quotas eines Workspace in einem einzigen Round-Trip holen – sieht so aus:

{
  "version": "1",
  "steps": [
    { "id": "all", "call": { "method": "GET",
      "path": "/api/usage-service/v1/workspaces/{workspace_id}/quotas" },
      "args": { "workspace_id": "$ctx.workspace_id" } }
  ],
  "return": { "all": "$all" }
}

$ctx.workspace_id wird automatisch aus der authentifizierten Session aufgelöst. Es geht nicht um das JSON – sondern darum, dass komplexe, mehrstufige Workflows dich nicht länger ein chattiges Hin und Her und einen Haufen Tokens kosten.

Loslegen

In Claude Desktop:

Settings → Connectors → Add custom connector.
Server-URL einfügen: https://app.neuroflash.com/api/mcp-server/v1/mcp.
Es öffnet sich ein Browserfenster – mit deinem neuroflash-Account anmelden und autorisieren.
Unter Tool Permissions die Tools auf Allow All setzen, damit Calls ohne Unterbrechung laufen.

In Cursor (das eine Loopback-OAuth-Bridge benötigt) – ergänze in ~/.cursor/mcp.json:

{
  "mcpServers": {
    "neuroflash": {
      "command": "npx",
      "args": ["mcp-remote", "https://app.neuroflash.com/api/mcp-server/v1/mcp"]
    }
  }
}

Jeder MCP-Client, der Streamable HTTP spricht und einen HTTPS- oder Loopback-Redirect nutzt, funktioniert genauso. Vollständiges Setup, die Tool-Referenz und Deep-Dives zu den Modes findest du in der Doku: https://neuro-flash.github.io/mcp-server/index.html

Ein Hinweis vorab: API- und MCP-Nutzung ziehen aus demselben Workspace-Kontingent wie die App. Es gibt kein separates Guthaben und keinen versteckten Zähler – was du in der UI verbrauchen würdest, verbrauchst du auch über die API. Und weil es neuroflash ist: DSGVO-konform, in Deutschland gehostet und ISO-27001-zertifiziert.

Warum das zählt

Das Spannende daran, einen Validierungs-Loop hinter eine API zu legen, ist nicht das Tooling – es ist, was Agenten nun damit anstellen können. Ein autonomer Workflow kann ein Dutzend Betreffzeilen-Varianten generieren, sie an ein echtes Zielgruppensegment schicken, nach erwarteter Resonanz ranken und erst dann senden. Der Schritt „an echten Menschen testen", der früher Wochen Marktforschung bedeutete, wird zu einem weiteren Aufruf in der Kette.

Das ist die Wette, die wir mit der API und dem MCP-Server eingehen: dass die nächste Generation von Content-Workflows nicht nur generiert – sondern generiert, validiert und entscheidet. Und das aus den Tools heraus, die du ohnehin schon nutzt.

Die neuroflash-API und der MCP-Server sind ab sofort verfügbar. Wenn du damit baust, freuen wir uns über dein Feedback – und dein erster Thread mit einem Digital Twin ist meistens der Moment, in dem es Klick macht.

Loslegen: MCP-Überblick · MCP-Server-Doku · API-Überblick · API-Doku