AI-Transkription mit whisperfile

OpenAI hat das AI-Transkribierungsmodell whisper veröffentlicht, was qualitativ hochwertige, lokale (auf ihrem eigenen Rechner) transkription von Audiodateien ermöglicht. In seiner originalen Implementierung benötigt dieses Modell eine leistungsfähige Grafikkarte, was den Betrieb auf den allermeisten PCs und Laptops ausschließt. Daraufhin wurde von der open-source community whisper.cpp entwickelt, was auf allen Rechnern mit mind. 8GB Arbeitsspeicher lauffähig, aber nicht ganz benutzerfreundlich ist. Das whisperfile Projekt implementiert whisper.cpp in einer einzigen Datei und macht die Benutzung sehr viel einfacher.

Das IDSL2 stellt Skripte bereit, mit denen die Benutzung weiter vereinfacht wird:

whisper_batch.bat (Windows), format_color_batch.py

Diese beiden Skripte müssen mit dem whisperfile (hier herunterladen, Windows: Umbenennen in “whsiper.exe”, Mac/Linux: Nicht umbennen) und allen Audiodateien in einem Ordner liegen.

UNIVERSITY OF COLOGNE

Faculty of Arts and HumanitiesDepartment of German Language and Literature II

AI-Transkription mit whisperfile