Instructomat – Von statischen Bildern zu sprechenden Anleitungen
Anleitungen schreiben kann mühsam sein – besonders, wenn man jede einzelne Aktion erklären muss. Der Instructomat nimmt dir genau diese Arbeit ab.
Dieses KI-gestützte Tool analysiert Screenshots, erkennt Inhalte und erstellt daraus automatische VoiceOver-Entwürfe für E-Learning-Videos. Dabei bleibt die Steuerung beim Menschen: Markierungen, Rahmen und Mausklicks sorgen dafür, dass die KI genau die Inhalte hervorhebt, die wichtig sind.
Das Beste daran? Der Instructomat wurde mit No-Code-Technologien gebaut – jede:r kann ihn nachbauen und anpassen. Ein Werkzeug, das nicht nur Zeit spart, sondern auch zeigt, wie künstliche Intelligenz und menschliches Wissen effizient zusammenarbeiten können.
Anleitung: Screenshots mit OpenAI GPT-4 verarbeiten und als Synthesia-Video zusammensetzen
Diese Beschreibung zeigt Schritt für Schritt, wie in Make (ehemals Integromat) mehrere Dateien (z. B. Screenshots als PNG-Dateien) aus Google Drive verarbeitet, mit GPT-4 (OpenAI API) angereichert und anschließend über die Synthesia-API zu einem Video zusammengefügt werden können. Sie ist als Musterlösung für Demonstrations- und Schulungszwecke gedacht und enthält Hinweise zu Transparenz, KI-Nutzung, Datenschutz, Haftung gemäß EU KI-Verordnung.
Ziel und Überblick
- Dateien (Screenshots) in Google Drive automatisch erkennen und herunterladen.
- Jede PNG-Datei an GPT-4 schicken, um eine Schritt-für-Schritt-Anleitung zu generieren.
- Alle Einträge in einem Array sammeln, wobei jede Datei später eine Szene in Synthesia repräsentiert.
- Synthesia „Create a Video“-Modul aufrufen und dabei die erforderlichen Felder füllen.
- Das finale Video wird in Synthesia erstellt und kann dort weiter bearbeitet werden.
Wichtige Hinweise (EU KI-Verordnung, Datenschutz, Haftung)
- Diese Anleitung dient ausschließlich zu Demonstrations- und Schulungszwecken.
- Transparenz: Der Prozess nutzt KI-Dienste von OpenAI (GPT-4) und Synthesia. Achte darauf, welche Daten (z. B. Bildinhalte) du an diese Dienste sendest.
- Datenschutz: Verwende keine personenbezogenen Daten in den Screenshots oder Prompts, es sei denn, eine gültige Rechtsgrundlage liegt vor und alle geltenden Datenschutzbestimmungen (z. B. DSGVO) werden eingehalten.
- Haftung und Nutzung: Prüfe stets die Korrektheit von KI-generierten Inhalten und halte dich an Lizenzbestimmungen. Du bist als Anwender:in für die Einhaltung von Gesetzen und Richtlinien verantwortlich.
- Vorbehalt: APIs und Rechtsvorschriften können sich ändern. Prüfe daher regelmäßig Dokumentationen und Bestimmungen.
Voraussetzungen
- Make-Account (ehemals Integromat).
- Google-Konto mit Zugriff auf den überwachten Drive-Ordner (z. B. „Screenshots“).
- OpenAI-API-Zugang.
- Synthesia-API-Zugang.
- Verbundene Connections in Make:
- Google Drive
- OpenAI (API-Token erforderlich)
- Synthesia (API-Token erforderlich)
Scenario-Aufbau in Make
Folgende Module kommen zum Einsatz (siehe Bild oben):
- Google Drive - Watch Files in a Folder
- Google Drive - Download a File
- OpenAI - Create a Completition
- Tools - Set multiple Variables
- Array Aggregator
- Synthesia - Create a Video
Google Drive - Watch Files in a Folder
- Dieses Modul überwacht den angegebenen Ordner in Google Drive (z. B. „Screenshots“).
- Stelle die Verbindung (Connection) zu Google her und wähle den gewünschten Ordner.
- Setze das Limit (Maximum number of results) so, dass pro Durchlauf mehrere Dateien erkannt werden können (z. B. 10, 50 oder 100). Hinweis: je nach Synthesia-Plan ist die Anzahl der Szenen beschränkt, die mit einem Flow erstellt werden können - zum Beispiel auf 6.
- Nach erfolgreicher Ausführung entsteht für jede neu gefundene Datei ein einzelner „Bundle“ im Scenario.
Google Drive - Download a File
- Verwende das Feld "File ID" aus dem vorherigen Modul („Google Drive - Watch Files in a Folder“), um die Datei als Binärdatei herunterzuladen. Damit wird der Screenshot (PNG) im Flow gespeichert, den du an GPT-4 übermitteln kannst.
OpenAI Create a Completition
- Wähle das Modell aus (z. B. „gpt-4o“) sowie gewünschte Parameter (z. B. max_tokens)
- Gib einen Prompt ein mit einer generischen Beschreibung und mit dem Screenshot als Image-URL
- Achte auf Rate Limits, API-Kosten und die Verfügbarkeit bestimmter Funktionen
- Die API-Antwort enthält den von GPT-4 generierten Text (z. B. eine Schritt-für-Schritt-Anleitung)
Set multiple variables
- Lege hier Variablen für Synthesia fest:
- background (Screenshots als URL
- scriptText (GPT-4 Resultat).
- avatar (ID des Avatars)
Array Aggregator
- Sammle alle Bundles aus dem vorigen Schritt in einem einzigen Array. Hierfür wähle "Google Drive - Watch Files in a Folder" als Source Module.
- Weise die Felder für jede Szene als Aggegated fields zu: background, scriptText, avatar.
- Stelle sicher, dass du beim „Group by“ immer denselben Wert verwendest, sodass alle Bundles in einer gemeinsamen Gruppe landen.
Synthesia – Create a Video
- Gebe das Array in den Scenes-Parameter ein.
- Jedes Element des Arrays repräsentiert eine Szene in deinem Video, einschließlich Hintergrundbild und dem von GPT-4 generierten Text.
- Nach erfolgreicher Ausführung wird das Video erstellt, und du kannst in Synthesia weitere Einstellungen vornehmen oder das Video herunterladen.
Typische Stolpersteine und Tipps
- Achte darauf, das Limit im „Watch files“-Modul hoch genug zu setzen, damit mehrere Dateien in einem einzigen Run verarbeitet werden.
- Stelle sicher, dass du die korrekten Felder aus dem GPT-4-Ergebnis und dem Drive-Download mappst.
- Prüfe OpenAI-Kosten (z. B. für GPT-4) und mögliche Rate Limits
- Schicke keine sensiblen oder personenbezogenen Daten an GPT-4 oder Synthesia, wenn dafür keine Rechtsgrundlage besteht.
- Überprüfe regelmäßig, ob du die aktuellen API-Standards und rechtlichen Vorgaben (z. B. EU KI-Verordnung) einhältst.
Fazit
Diese Musterlösung veranschaulicht, wie du Screenshots aus Google Drive automatisch einliest, mithilfe von GPT-4 zu weiterführenden Erklär-Texten verarbeitest und die Ergebnisse anschließend in Synthesia zu einem zusammenhängenden Video verknüpfst.
Bei der Umsetzung sind Transparenz, Datenschutz und eine sorgfältige Prüfung der KI-Ergebnisse besonders wichtig.
Da sich sowohl regulatorische Bestimmungen als auch API-Spezifikationen ändern können, solltest du deine Lösungen regelmäßig überprüfen und nur in einer kontrollierten Umgebung nutzen, bevor du sie produktiv einsetzt.
Diese Anleitung dient ausschließlich zu Demonstrations- und Schulungszwecken und erhebt keinen Anspruch auf Vollständigkeit oder rechtliche Verbindlichkeit.
Beachte auch den Haftungsausschluss: Link