1. Vorbereitung
Die Audiodateien werden in Audacity sauber zugeschnitten.
Dies sind die drei Schritte, die insgesamt notwendig sind, damit der Chatbot zuverlässig auf Ihre Inhalte antworten kann:
Die Audiodateien werden in Audacity sauber zugeschnitten.
Die geschnittenen Audiodateien werden mithilfe Cyberduck in den Server hochgeladen.
Im Anschluss werden diese über das Webportal verarbeitet.
In OpenWebUI kann der Nutzer auf die verarbeiteten Inhalte im Chatbot zugreifen.
Bevor die Rede transkribiert werden kann, muss die Audiodatei vorbereitet werden. Ziel ist es, nur den relevanten Redeanteil zu übernehmen und in ein kompaktes, webfreundliches Format zu exportieren.
Suchen Sie Ihre Audiodatei auf dem Computer (z. B. auf einem USB-Stick oder auf dem Schreibtisch).
Starten Sie Audacity und ziehen Sie die Audiodatei in das leere graue Feld.
Gut zu wissen: Maximieren Sie nach dem Import das Audacity-Fenster, um mehr von der Tonspur zu sehen.
Bewegen Sie die Maus an den Redeanfang und zoomen Sie mit Strg + Mausrad hinein.
Gut zu wissen: Es wird immer dort gezoomt, wo sich der Mauszeiger befindet.
Klicken Sie in die Zeitleiste, um die Aufnahme abzuspielen.
Gut zu wissen: Wo die Tonspur deutlich ausschlägt, beginnt in der Regel die Sprache.
Löschen- oder Entfernen-Taste.Wichtig: Markieren Sie, bis eine gelbe vertikale Linie erscheint.
Ziehen Sie die untere Scrollleiste ganz nach rechts. So gelangen Sie an das Ende der Tonspur.
Klicken Sie in die Zeitleiste, um die Aufnahme abzuspielen.
Gut zu wissen: Zoomen Sie bei Bedarf näher heran, um das Ende der Rede genauer bestimmen zu können.
Löschen- oder Entfernen-Taste.Wichtig: Markieren Sie, bis eine gelbe vertikale Linie erscheint.
Öffnen Sie Datei -> Audio exportieren.
Wählen Sie Auf dem Computer exportieren.
Gut zu wissen: Klicken Sie unten links auf „Nicht mehr anzeigen“.
Gut zu wissen: Die 98 kbps sorgen für eine viel kleinere Dateigröße bei fast gleichbleibender Audioqualität.
Die zurechtgeschnittene Rede muss nun auf den Server geladen werden, damit diese transkribiert und in die Datenbank geladen werden kann.
Gut zu wissen: Der Zugang „uploader“ hat nur die Berechtigung, Dateien hochzuladen.
Wichtig: Maximal eine Datei je Ordner
Wichtig: Die Programmflyer müssen als PDF vorliegen.
Öffnen Sie folgende Webseite: [Link folgt]
Gut zu wissen: Wenn die Anmeldeaufforderung erscheint, melden Sie sich mit den n8n-Zugangsdaten an.
Gut zu wissen: Je nach Länge der Audiodatei und Umfang des Programmflyers, kann die Verarbeitung mehrere Minuten dauern.
Wenn die Anzeige auf folgendes Fenster wechselt:
Wenn zwei neue Dateien im Ordner "02_zur_pruefung" erscheinen:
Gut zu wissen: Sie können auch ein anderes Textbearbeitungsprogramm nutzen.
Gut zu wissen: Der Dateiname der transkribierten Rede besteht aus den angegebenen Informationen des Anfangsformulars.
STRG+SBei Bedarf überprüfen Sie auch den gescannten Programmflyer, auf ähnlicher Art und Weise.
Gut zu wissen: Die Zeitangaben können um ein paar Sekunden abweichen. Das ist normal.
Gut zu wissen: Je nach Länge der Transkriptionsdatei und Umfang des Programmflyers, kann die Verarbeitung mehrere Minuten dauern.
Nach erfolgreichem Abschluss:
Gut zu wissen: Alle eingelesenen Transkriptionen und Programmflyer befinden sich im Ordner "99_eingelesen".
Falls Sie versehentlich Audiodateien, andere m4a- oder PDF-Dateien in die Datenbank eingelesen haben, können Sie diese wie folgt wieder aus der Datenbank entfernen:
Gut zu wissen: Wenn die Anmeldeaufforderung erscheint, melden Sie sich mit den n8n-Zugangsdaten an.
Verschieben Sie die zu löschenden HTML-Dateien in Cyberduck aus dem Ordner "99_eingelesen" in den Ordner "zum_loeschen".
Nachdem Sie die Dateien in den Ordner "zum_loeschen" verschoben haben:
Nach einer Weile erscheint folgende Meldung:
Gut zu wissen: Die HTML-Dateien werden ebenfalls aus dem Ordner "zum_loeschen" gelöscht.