Dank KI: Mac-Aufnahmetool Audio Hijack schreibt mit

9 Nov 2023
Mac

Der Audiospezialist Rogue Amoeba hat eine nützliche neue Funktion in sein Aufnahmewerkzeug Audio Hijack gesteckt: Mit Version 4.3 lassen sich Audioinhalte auch gleich automatisiert transkribieren. Dazu gibt es einen neuen "Transcribe Block", den man per Template oder einfaches Drag & Drop in sein Aufnahme-Setup einschieben kann. Als technische Basis dient dabei Whisper, die Open-Source-basierte Transkribierungs-Engine von OpenAI.

Open-Source-ASR direkt bei der Aufnahme

Whisper ist ein sogenanntes ASR-System (Automatic Speech Recognition). Es wurde mit rund 700.000 Stunden Sprache in verschiedenen Zungenschlägen trainiert, versteht also nicht nur Englisch, sondern auch Deutsch und andere Sprachen. Das System gilt als robust und genau; für die gebotene Qualität musste man zuvor kommerzielle Dienste nutzen. Es gibt bereits seit Längerem diverse kostenlose und kostenpflichtige Mac-Clients für Whisper im App Store und anderswo. Eine Transkribierung gleich in eine Recorder-App zu integrieren, macht die Nutzung noch bequemer.

Audio Hijack nimmt Audio der unterschiedlichsten Quellen auf dem Mac auf – beispielsweise nur von vorher ausgewählten Apps, Audio-Eingängen oder Geräten. Die App enthält zahlreiche Filter und Einstellungsmöglichkeiten für das Routing von Audio. Audio Hijack ist seit vielen Jahren verfügbar und unter anderem bei Podcastern beliebt. Mit Version 4 hatte es im vergangenen Jahr einen größeren Rewrite gegeben.

Keine zusätzlichen Kosten, aber noch Beta

Die Nutzung von Whisper hat den Vorteil, dass die Transkribierung direkt auf dem Mac erfolgt und nicht in der Cloud. Es entstehen – wie bei OpenAI-API-Zugriffen sonst üblich – keine zusätzlichen Kosten, man kann so viel transkribieren lassen, wie man möchte. Die Einfügung des Transcribe Block kann direkt hinter eine Audioquelle erfolgen; das kann auch das Mikrofon sein, um Texte zu diktieren. Auch das Verschriftlichen von Audioanrufen oder YouTube-Videos aus einem Browser ist so möglich. Nutzer können zwischen verschiedenen Modi von Whisper wählen, darunter dem sehr genauen. Das Transcript wird mit Zeitmarken versehen.

Aktuell ist die Transkribierung in Audio Hijack 4.3 noch in einer Betaphase (was nicht für die restliche App gilt). Werden Probleme entdeckt, sollte man diese an Rogue Amoeba melden. Audio Hijack wird nicht im Abo, sondern als Einmalzahlung vermarketet. Diese kostet inklusive deutscher Umsatzsteuer derzeit 77 US-Dollar. Upgrades von Audio Hijack 3 kostet 35 Dollar plus Steuer.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Preisvergleiche immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(bsc)

Mehr lesen
Ähnliche Nachrichten
Die beliebtesten Nachrichten der Woche