Skip to main content

Instructomat – Von statischen Bildern zu sprechenden Anleitungen

Anleitungen schreiben kann mühsam sein – besonders, wenn man jede einzelne Aktion erklären muss. Der Instructomat nimmt dir genau diese Arbeit ab.

Dieses KI-gestützte Tool analysiert Screenshots, erkennt Inhalte und erstellt daraus automatische VoiceOver-Entwürfe für E-Learning-Videos. Dabei bleibt die Steuerung beim Menschen: Markierungen, Rahmen und Mausklicks sorgen dafür, dass die KI genau die Inhalte hervorhebt, die wichtig sind.

Das Beste daran? Der Instructomat wurde mit No-Code-Technologien gebaut – jede:r kann ihn nachbauen und anpassen. Ein Werkzeug, das nicht nur Zeit spart, sondern auch zeigt, wie künstliche Intelligenz und menschliches Wissen effizient zusammenarbeiten können.

Anleitung: Screenshots mit OpenAI GPT-4 verarbeiten und als Synthesia-Video zusammensetzen

Diese Beschreibung zeigt Schritt für Schritt, wie in Make (ehemals Integromat) mehrere Dateien (z. B. Screenshots als PNG-Dateien) aus Google Drive verarbeitet, mit GPT-4 (OpenAI API) angereichert und anschließend über die Synthesia-API zu einem Video zusammengefügt werden können. Sie ist als Musterlösung für Demonstrations- und Schulungszwecke gedacht und enthält Hinweise zu Transparenz, KI-Nutzung, Datenschutz, Haftung gemäß EU KI-Verordnung.

Ziel und Überblick

  • Dateien (Screenshots) in Google Drive automatisch erkennen und herunterladen.
  • Jede PNG-Datei an GPT-4 schicken, um eine Schritt-für-Schritt-Anleitung zu generieren.
  • Alle Einträge in einem Array sammeln, wobei jede Datei später eine Szene in Synthesia repräsentiert.
  • Synthesia „Create a Video“-Modul aufrufen und dabei die erforderlichen Felder füllen.
  • Das finale Video wird in Synthesia erstellt und kann dort weiter bearbeitet werden.

Wichtige Hinweise (EU KI-Verordnung, Datenschutz, Haftung)

  • Diese Anleitung dient ausschließlich zu Demonstrations- und Schulungszwecken.
  • Transparenz: Der Prozess nutzt KI-Dienste von OpenAI (GPT-4) und Synthesia. Achte darauf, welche Daten (z. B. Bildinhalte) du an diese Dienste sendest.
  • Datenschutz: Verwende keine personenbezogenen Daten in den Screenshots oder Prompts, es sei denn, eine gültige Rechtsgrundlage liegt vor und alle geltenden Datenschutzbestimmungen (z. B. DSGVO) werden eingehalten.
  • Haftung und Nutzung: Prüfe stets die Korrektheit von KI-generierten Inhalten und halte dich an Lizenzbestimmungen. Du bist als Anwender:in für die Einhaltung von Gesetzen und Richtlinien verantwortlich.
  • Vorbehalt: APIs und Rechtsvorschriften können sich ändern. Prüfe daher regelmäßig Dokumentationen und Bestimmungen.

Voraussetzungen

  • Make-Account (ehemals Integromat).
  • Google-Konto mit Zugriff auf den überwachten Drive-Ordner (z. B. „Screenshots“).
  • OpenAI-API-Zugang.
  • Synthesia-API-Zugang.
  • Verbundene Connections in Make:
    • Google Drive
    • OpenAI (API-Token erforderlich)
    • Synthesia (API-Token erforderlich)

Scenario-Aufbau in Make

Folgende Module kommen zum Einsatz (siehe Bild oben):

  • Google Drive - Watch Files in a Folder
  • Google Drive - Download a File
  • OpenAI - Create a Completition
  • Tools - Set multiple Variables 
  • Array Aggregator
  • Synthesia - Create a Video 

Google Drive - Watch Files in a Folder

  • Dieses Modul überwacht den angegebenen Ordner in Google Drive (z. B. „Screenshots“).
  • Stelle die Verbindung (Connection) zu Google her und wähle den gewünschten Ordner.
  • Setze das Limit (Maximum number of results) so, dass pro Durchlauf mehrere Dateien erkannt werden können (z. B. 10, 50 oder 100). Hinweis: je nach Synthesia-Plan ist die Anzahl der Szenen beschränkt, die mit einem Flow erstellt werden können - zum Beispiel auf 6.
  • Nach erfolgreicher Ausführung entsteht für jede neu gefundene Datei ein einzelner „Bundle“ im Scenario.

Google Drive - Download a File

  • Verwende das Feld "File ID" aus dem vorherigen Modul („Google Drive - Watch Files in a Folder“), um die Datei als Binärdatei herunterzuladen. Damit wird der Screenshot (PNG) im Flow gespeichert, den du an GPT-4 übermitteln kannst.

OpenAI Create a Completition

  • Wähle das Modell aus (z. B. „gpt-4o“) sowie gewünschte Parameter (z. B. max_tokens)
  • Gib einen Prompt ein mit einer generischen Beschreibung und mit dem Screenshot als Image-URL
  • Achte auf Rate Limits, API-Kosten und die Verfügbarkeit bestimmter Funktionen
  • Die API-Antwort enthält den von GPT-4 generierten Text (z. B. eine Schritt-für-Schritt-Anleitung)

Set multiple variables

  • Lege hier Variablen für Synthesia fest:
    • background (Screenshots als URL
    • scriptText (GPT-4 Resultat).
    • avatar (ID des Avatars)

Array Aggregator

  • Sammle alle Bundles aus dem vorigen Schritt in einem einzigen Array. Hierfür wähle "Google Drive - Watch Files in a Folder" als Source Module.
  • Weise die Felder für jede Szene als Aggegated fields zu: background, scriptText, avatar.
  • Stelle sicher, dass du beim „Group by“ immer denselben Wert verwendest, sodass alle Bundles in einer gemeinsamen Gruppe landen.

Synthesia – Create a Video

  • Gebe das Array in den Scenes-Parameter ein.
  • Jedes Element des Arrays repräsentiert eine Szene in deinem Video, einschließlich Hintergrundbild und dem von GPT-4 generierten Text.
  • Nach erfolgreicher Ausführung wird das Video erstellt, und du kannst in Synthesia weitere Einstellungen vornehmen oder das Video herunterladen.

Typische Stolpersteine und Tipps

  • Achte darauf, das Limit im „Watch files“-Modul hoch genug zu setzen, damit mehrere Dateien in einem einzigen Run verarbeitet werden.
  • Stelle sicher, dass du die korrekten Felder aus dem GPT-4-Ergebnis und dem Drive-Download mappst.
  • Prüfe OpenAI-Kosten (z. B. für GPT-4) und mögliche Rate Limits 
  • Schicke keine sensiblen oder personenbezogenen Daten an GPT-4 oder Synthesia, wenn dafür keine Rechtsgrundlage besteht.
  • Überprüfe regelmäßig, ob du die aktuellen API-Standards und rechtlichen Vorgaben (z. B. EU KI-Verordnung) einhältst.

Fazit

Diese Musterlösung veranschaulicht, wie du Screenshots aus Google Drive automatisch einliest, mithilfe von GPT-4 zu weiterführenden Erklär-Texten verarbeitest und die Ergebnisse anschließend in Synthesia zu einem zusammenhängenden Video verknüpfst.

Bei der Umsetzung sind Transparenz, Datenschutz und eine sorgfältige Prüfung der KI-Ergebnisse besonders wichtig.

Da sich sowohl regulatorische Bestimmungen als auch API-Spezifikationen ändern können, solltest du deine Lösungen regelmäßig überprüfen und nur in einer kontrollierten Umgebung nutzen, bevor du sie produktiv einsetzt.

Diese Anleitung dient ausschließlich zu Demonstrations- und Schulungszwecken und erhebt keinen Anspruch auf Vollständigkeit oder rechtliche Verbindlichkeit.

Beachte auch den Haftungsausschluss: Link