Comment retranscrire de gros fichiers audio automatiquement
Pour les geeks refoulés (comme moi) parmi vous...
Mise à jour du 10 novembre 2024 :
J’ai découvert une méthode très rapide et gratuite de transcription de gros fichiers audio (5 heures d’audio reetranscrites en 9 minutes avec très peu d’erreurs hormis sur les noms propres) en passant par Kaggle.com plutôt que par Google Colab. Si vous désirez une nouvelle vidéo d’explications détaillées, demandez-la par email…
Voici le lien pour accéder au programme de retranscription après vous être créé un compte Google Colab (regardez d’abord la vidéo avant d’utiliser le lien…)
https://colab.research.google.com/drive/1srjHp_YjsXr92fNBsYIm3plG9sUoVKy7?usp=sharing
J’ai trouvé encore plus rapide (modèle Whisper V3: 4 heures d’audio retranscrites en 7 minutes!), pour ceux qui ont compris comment fonctionnait Colab:
Créer un nouveau notebook vierge puis écrire ce script en lançant chaque cellule quand la précédente a terminé (ça prend 3 minutes en tout) :
!pip install --upgrade pip
!pip install --upgrade transformers datasets[audio] accelerate
import torch
from transformers import pipeline
pipe = pipeline("automatic-speech-recognition",
"openai/whisper-large-v3-turbo",
torch_dtype=torch.float16,
device="cuda:0")
pipe ("NOM DE VOTRE FICHIER AUDIO importé dans le dossier Fichiers sur la gauche", return_timestamps=True)
Merci beaucoup ! 🙂