Evangelische Akademie Tutzing · Anleitung zum Chatbot

Anleitung: Von der Rede zum Chatbot

Übersicht

Dies sind die drei Schritte, die insgesamt notwendig sind, damit der Chatbot zuverlässig auf Ihre Inhalte antworten kann:

1. Vorbereitung

Die Audiodateien werden in Audacity sauber zugeschnitten.

2. Upload

Die geschnittenen Audiodateien werden mithilfe Cyberduck in den Server hochgeladen.

3. Verarbeitung

Im Anschluss werden diese über das Webportal verarbeitet.

Fertig: Chatbot

In OpenWebUI kann der Nutzer auf die verarbeiteten Inhalte im Chatbot zugreifen.

Gut zu wissen:
  1. Navigieren Sie in der linken und rechten Spalte, um schneller an einzelne Schritte zu gelangen.
  2. Vergrößern Sie Bilder bei Bedarf per Klick.

Vorbereitung in Audacity

Bevor die Rede transkribiert werden kann, muss die Audiodatei vorbereitet werden. Ziel ist es, nur den relevanten Redeanteil zu übernehmen und in ein kompaktes, webfreundliches Format zu exportieren.

Suchen Sie Ihre Audiodatei auf dem Computer (z. B. auf einem USB-Stick oder auf dem Schreibtisch).

1. Import

Starten Sie Audacity und ziehen Sie die Audiodatei in das leere graue Feld.

Gut zu wissen: Maximieren Sie nach dem Import das Audacity-Fenster, um mehr von der Tonspur zu sehen.

Importierte Audioaufzeichnung in Audacity

2. Zoomen in die Tonspur

Bewegen Sie die Maus an den Redeanfang und zoomen Sie mit Strg + Mausrad hinein.

Gut zu wissen: Es wird immer dort gezoomt, wo sich der Mauszeiger befindet.

Maus am Redeanfang und mit Strg plus Mausrad zoomen

3. Redeanfang bestimmen

Klicken Sie in die Zeitleiste, um die Aufnahme abzuspielen.

Gut zu wissen: Wo die Tonspur deutlich ausschlägt, beginnt in der Regel die Sprache.

Marker kurz vor dem Redeanfang setzen

4. Vorlauf löschen

  1. Markieren Sie mit gedrückter Maustaste den gesamten linken Bereich vor dem Redeanfang, den Sie entfernen möchten.
  2. Löschen Sie die markierte Stelle mit der Löschen- oder Entfernen-Taste.

Wichtig: Markieren Sie, bis eine gelbe vertikale Linie erscheint.

Redeanfang in der Tonspur bestimmen

5. Tonspurnavigation

Ziehen Sie die untere Scrollleiste ganz nach rechts. So gelangen Sie an das Ende der Tonspur.

Mit Scrollleiste zum Redeende navigieren

6. Redeende bestimmen

Klicken Sie in die Zeitleiste, um die Aufnahme abzuspielen.

Gut zu wissen: Zoomen Sie bei Bedarf näher heran, um das Ende der Rede genauer bestimmen zu können.

Marker am Ende der Rede setzen

7. Nachlauf löschen

  1. Markieren Sie mit gedrückter Maustaste den gesamten rechten Bereich nach dem Redeende, den Sie entfernen möchten.
  2. Löschen Sie die markierte Stelle mit der Löschen- oder Entfernen-Taste.

Wichtig: Markieren Sie, bis eine gelbe vertikale Linie erscheint.

Nachlauf rechts vom Redeende markieren

8. Rede exportieren

Öffnen Sie Datei -> Audio exportieren.

Menüpunkt Audio exportieren öffnen

9. Export auf lokal setzen

Wählen Sie Auf dem Computer exportieren.

Gut zu wissen: Klicken Sie unten links auf „Nicht mehr anzeigen“.

Auf dem Computer exportieren auswählen

10. Exportwerte setzen

  1. Vergeben Sie einen passenden Dateinamen oder übernehmen Sie den vorhandenen.
  2. Wählen Sie den Zielordner für den Export.
  3. Wählen Sie das Format M4A (AAC)-Dateien (FFmpeg) aus.
  4. Setzen Sie die Qualität auf 98 kbps.
  5. Klicken Sie auf Exportieren.

Gut zu wissen: Die 98 kbps sorgen für eine viel kleinere Dateigröße bei fast gleichbleibender Audioqualität.

Exportdialog mit den markierten Punkten 1 bis 4
Ergebnis: Sie haben eine sauber geschnittene und in der Dateigröße verkleinerte Rede für Cyberduck.

Upload mit Cyberduck

Die zurechtgeschnittene Rede muss nun auf den Server geladen werden, damit diese transkribiert und in die Datenbank geladen werden kann.

1. Verbindung mit Server

  1. Öffnen Sie das Programm Cyberduck.
  2. Wählen Sie in Ihren Lesezeichen den Zugang „uploader“ aus.
  3. Doppelklicken Sie auf „uploader“, um sich mit dem Server zu verbinden.

Gut zu wissen: Der Zugang „uploader“ hat nur die Berechtigung, Dateien hochzuladen.

Cyberduck-Verbindung mit dem Eintrag Uploader

2. Rede und Flyer hochladen

  1. Ziehen Sie die Rede in den Ordner „01_audio“.
  2. Ziehen Sie den Programmflyer in den Ordner „01_programmflyer“.
  3. Warten Sie, bis der Upload abgeschlossen ist und beide Dateien in den Ordnern sichtbar sind.

Wichtig: Maximal eine Datei je Ordner

Wichtig: Die Programmflyer müssen als PDF vorliegen.

Cyberduck mit Ordnern audio und docs sowie Upload von Rede und Programmflyer
Ergebnis: Die beiden Dateien sind zur Verarbeitung bereit.

Dateienverarbeitung starten

Öffnen Sie folgende Webseite: [Link folgt]

Gut zu wissen: Wenn die Anmeldeaufforderung erscheint, melden Sie sich mit den n8n-Zugangsdaten an.

1. Formular ausfüllen

  1. Kreuzen Sie an, ob Sie eine Rede und/oder ein Programmflyer hochgeladen haben.
  2. Tragen Sie die Hauptredner:innen der Audiodatei ein. Trennen Sie mehrere Redner:innen mit einem Semikolon (;).
  3. Tragen Sie den Titel der Veranstaltung ein.
  4. Tragen Sie das Datum ein, an dem die Veranstaltung stattfand.
  5. Starten Sie die Dateienverarbeitung.

Gut zu wissen: Je nach Länge der Audiodatei und Umfang des Programmflyers, kann die Verarbeitung mehrere Minuten dauern.

Webformular zur Dateienverarbeitung

2. Verarbeitete Dateien prüfen

Wenn die Anzeige auf folgendes Fenster wechselt:

Formularanzeige nach erfolgreicher Verarbeitung
  1. Wechseln Sie zu Cyberduck.
  2. Klicken Sie auf "Neu laden".
Cyberduck Ordnerinhalt neu laden

Wenn zwei neue Dateien im Ordner "02_zur_pruefung" erscheinen:

  1. Wählen Sie die transkribierte Rede-Datei aus.
  2. Klicken Sie auf das Bearbeiten-Drop-Down-Menü und wählen Sie "Word".

Gut zu wissen: Sie können auch ein anderes Textbearbeitungsprogramm nutzen.

Gut zu wissen: Der Dateiname der transkribierten Rede besteht aus den angegebenen Informationen des Anfangsformulars.

Datei in Word öffnen über Cyberduck

3. Überprüfen der Verarbeitung

  1. Öffnen Sie die Rede (a.) mit einem Medienplayer.
  2. Ziehen Sie das geöffnete Word-Fenster (b.) neben den Medienplayer.
  3. Vergleichen Sie ein paar Stellen aus der Rede mit der Transkription:
    • Stimmen die Zeitstempel?
    • Stimmen die Transkriptionen wichtiger Begriffe und Namen?
  4. Falls Sie Fehler in der Transkription entdecken, können Sie diese nun korrigieren.
  5. Wenn Sie zufrieden sind, speichern Sie das Worddokument mit STRG+S
  6. Schließen Sie beide Fenster.

Bei Bedarf überprüfen Sie auch den gescannten Programmflyer, auf ähnlicher Art und Weise.

Gut zu wissen: Die Zeitangaben können um ein paar Sekunden abweichen. Das ist normal.

Rede und Transkription nebeneinander prüfen

4. Freigabe erteilen

  1. Wechseln Sie erneut zum Formular
  2. Kreuzen Sie "Ja, geprüft und gespeichert" an
  3. Klicken Sie auf "Weiter mit Einlesen"

Gut zu wissen: Je nach Länge der Transkriptionsdatei und Umfang des Programmflyers, kann die Verarbeitung mehrere Minuten dauern.

Freigabe im Formular bestätigen

5. Abschluss

Nach erfolgreichem Abschluss:

  1. Schließen Sie das Fenster.
  2. Öffnen Sie OpenWebUI unter der Adresse: [Link folgt]
  3. Starten Sie einen Chat

Gut zu wissen: Alle eingelesenen Transkriptionen und Programmflyer befinden sich im Ordner "99_eingelesen".

Erfolgreicher Abschluss der Verarbeitung
Ergebnis: Die Dateien wurden erfolgreich verarbeitet und stehen im Chatbot zur Verfügung.

Datenbankeinträge löschen

Falls Sie versehentlich Audiodateien, andere m4a- oder PDF-Dateien in die Datenbank eingelesen haben, können Sie diese wie folgt wieder aus der Datenbank entfernen:

1. Löschformular öffnen

  1. Öffnen Sie folgende Webseite: [Link folgt]
  2. Klicken Sie auf "Ich möchte Datenbankeinträge löschen"

Gut zu wissen: Wenn die Anmeldeaufforderung erscheint, melden Sie sich mit den n8n-Zugangsdaten an.

Löschformular öffnen

2. Dateien verschieben

Verschieben Sie die zu löschenden HTML-Dateien in Cyberduck aus dem Ordner "99_eingelesen" in den Ordner "zum_loeschen".

HTML-Dateien in Cyberduck verschieben

3. Löschung bestätigen

Nachdem Sie die Dateien in den Ordner "zum_loeschen" verschoben haben:

  1. Kreuzen Sie "Ja, die HTML-Dateien liegen im Ordner "zum_loeschen"" an
  2. Klicken Sie auf "Löschung starten"
Löschung bestätigen und starten

4. Ergebnis

Nach einer Weile erscheint folgende Meldung:

Erfolgsmeldung nach Löschung

Gut zu wissen: Die HTML-Dateien werden ebenfalls aus dem Ordner "zum_loeschen" gelöscht.