Comment retranscrire de gros fichiers audio automatiquement

Pour les geeks refoulés (comme moi) parmi vous...

nov. 09, 2024

Mise à jour du 10 novembre 2024 :

J’ai découvert une méthode très rapide et gratuite de transcription de gros fichiers audio (5 heures d’audio reetranscrites en 9 minutes avec très peu d’erreurs hormis sur les noms propres) en passant par Kaggle.com plutôt que par Google Colab. Si vous désirez une nouvelle vidéo d’explications détaillées, demandez-la par email…

Voici le lien pour accéder au programme de retranscription après vous être créé un compte Google Colab (regardez d’abord la vidéo avant d’utiliser le lien…)

https://colab.research.google.com/drive/1srjHp_YjsXr92fNBsYIm3plG9sUoVKy7?usp=sharing

J’ai trouvé encore plus rapide (modèle Whisper V3: 4 heures d’audio retranscrites en 7 minutes!), pour ceux qui ont compris comment fonctionnait Colab:

Créer un nouveau notebook vierge puis écrire ce script en lançant chaque cellule quand la précédente a terminé (ça prend 3 minutes en tout) :

!pip install --upgrade pip

!pip install --upgrade transformers datasets[audio] accelerate

import torch

from transformers import pipeline

pipe = pipeline("automatic-speech-recognition",

               "openai/whisper-large-v3-turbo",

               torch_dtype=torch.float16,

               device="cuda:0")

pipe ("NOM DE VOTRE FICHIER AUDIO importé dans le dossier Fichiers sur la gauche", return_timestamps=True)

Stéphane Zagdanski

Discussion à propos de ce post