PardiSpeech – préparation, IST et inférence
Préparer les segments avec WhisperX
Corriger le texte dans le tableau
Construire le dataset latent
Estimer ou charger un IST
Injecter l'IST à l'inférence
1) Préparation dataset
2) IST
3) Inférence
1) Préparation dataset
2) IST
3) Inférence
Charger plusieurs audios ou un dossier
Plusieurs fichiers audio (wav/flac/mp3/opus)
Drop File Here
- or -
Click to Upload
Ou un dossier audio
Drop File Here
- or -
Click to Upload
WhisperX model
Task
Langue
Batch size
Transcrire + aligner
Status
Segments éditables
Segments éditables
audio_path
segment_id
start
end
text
Segments éditables
audio_path
segment_id
start
end
text
+
Nom du dataset
my_dataset
Durée min segment (sec)
Durée max segment (sec)
Construire le dataset latent
Télécharger le dataset latent (.zip)
Dataset status
Dataset dir courant
Gérer, estimer et charger des IST
Texte à synthétiser
Synthétiser