Back to all articles
Taylor Brooks

Tout sur les fichiers VTT : créer, modifier et corriger vite

Maîtrisez les fichiers VTT : créez, éditez et corrigez vos timelines rapidement grâce à nos outils et astuces pour créateurs vidéo.

Introduction

Pour les créateurs de vidéos, les monteurs dédiés à l’accessibilité et les podcasteurs, un fichier VTT n’est pas juste un format de sous-titres de plus : c’est la clé pour rendre le contenu consultable, accessible et parfaitement synchronisé sur toutes les plateformes. Le WebVTT (Web Video Text Tracks) est le format normalisé par le W3C pour le texte synchronisé dans la vidéo HTML5. Il prend en charge les sous-titres, les légendes, les descriptions et même les chapitres, avec une précision au milliseconde près.

Que vous partiez de zéro ou que vous convertissiez une transcription automatique, produire un VTT valide implique de respecter à la lettre la syntaxe, les horodatages et l’encodage. Pour beaucoup de créateurs, la tâche peut sembler fastidieuse — surtout quand il faut corriger des chevauchements d’horodatage ou convertir depuis un format comme le SRT. C’est là que des méthodes plus efficaces, notamment les outils d’automatisation comme la génération précise de transcription avec identification des intervenants, peuvent accélérer considérablement le passage du dialogue brut aux sous-titres parfaitement calés.

Ce guide va couvrir :

  • L’anatomie complète d’un fichier VTT, y compris l’en-tête, les blocs de “cues” et les règles de formatage
  • Comment rédiger un fichier VTT à la main dans un éditeur texte simple
  • Les erreurs fréquentes d’horodatage et comment les corriger rapidement
  • L’importation d’une transcription existante et son alignement avec l’audio
  • Une checklist de contrôle avant de mettre en ligne votre fichier VTT

Comprendre la structure d’un fichier VTT

Un fichier VTT valide doit respecter une structure précise. Selon la spécification WebVTT du W3C, chaque fichier commence par l’en-tête WEBVTT, suivi de “cues” avec des horodatages précis.

Structure de base

Un fichier VTT minimal ressemble à ceci :

```
WEBVTT

00:00:00.000 --> 00:00:04.000
Voici le premier sous-titre.

00:00:04.000 --> 00:00:07.500
Voici le deuxième.
```

Détaillons :

  1. En-tête : Le fichier doit commencer par WEBVTT (éventuellement suivi d’un titre ou de métadonnées). Il faut au moins deux retours à la ligne avant le premier “cue”.
  2. Cues :
  • ID de cue optionnel : Une étiquette permettant d’identifier le bloc.
  • Horodatage : format hh:mm:ss.mmm --> hh:mm:ss.mmm, avec un espace de chaque côté de -->.
  • Texte/Payload : Le contenu ou le formatage affiché à l’écran.
  • Ligne vide : Sépare chaque “cue” du suivant.

Points de formatage importants

  • La précision au milliseconde est obligatoire : ne supprimez pas .mmm même si c’est .000.
  • Utilisez toujours le point (.) entre secondes et millisecondes ; les virgules sont propres au SRT et provoqueront des erreurs au parsing.
  • Les lignes vides entre les cues sont impératives ; leur absence bloque la lecture dans la plupart des navigateurs.
  • Évitez de placer --> dans le texte d’un cue : cela perturbe l’interpréteur.

Ces détails comptent, car les lecteurs embarqués comme JW Player peuvent rejeter des sous-titres qui ne respectent pas la syntaxe. Les exigences plus strictes sur le type MIME (text/vtt) imposées par les navigateurs modernes rendent la conformité à la spécification plus cruciale que jamais.


Rédiger un fichier VTT avec un éditeur texte simple

Créer un VTT à la main n’est pas compliqué, mais demande de la rigueur. Ouvrez un éditeur de texte brut comme Notepad++, Sublime Text ou VS Code.

Encodage : UTF-8 sans BOM

WebVTT gère l’UTF-8 avec BOM optionnel, mais il est plus sûr d’utiliser “UTF-8 sans BOM” pour éviter des soucis de compatibilité : certaines plateformes interprètent mal le BOM et génèrent des caractères illisibles pour les écritures non latines. Dans votre éditeur :

  • Choisissez l’encodage UTF-8 (sans BOM)
  • Enregistrez le fichier avec l’extension .vtt

Cela garantit une lecture correcte des textes multilingues sur tous les navigateurs.

Désactiver l’auto-formatage

Certains éditeurs ajoutent automatiquement des retours à la ligne ou des caractères invisibles. Désactivez ces fonctions : des éléments parasites peuvent invalider vos légendes.

Si l’alignement manuel vous paraît trop laborieux, gagnez du temps en partant d’un texte de transcription propre. Par exemple, importer directement depuis un générateur de sous-titres structuré comme sortie de sous-titres structurée permet d’obtenir immédiatement des “cues” bien segmentés et avec des horaires valides.


Corriger les erreurs fréquentes de timestamp

Même les éditeurs expérimentés commettent parfois des erreurs minimes qui provoquent un rejet ou un décalage à la lecture.

Heures avec deux chiffres

Toujours ajouter un zéro devant les heures : par exemple 00: pour un fichier de moins d’une heure. 0:02:15.500 est invalide ; le format correct est 00:02:15.500.

Chevauchements

Assurez-vous que chaque fin de cue est strictement antérieure au début du suivant (sauf cas de chapitres). Des timings qui se chevauchent peuvent faire disparaître ou sauter des sous-titres.

Format du séparateur

Il faut un espace autour de -->, sinon erreur :

  • Invalide : 00:00:01.000-->00:00:04.000
  • Valide : 00:00:01.000 --> 00:00:04.000

Précision en millisecondes

Ne laissez pas les millisecondes vides. Les plateformes attendent le format complet hh:mm:ss.mmm — même si c’est .000.

Corriger manuellement dans un gros fichier peut être fastidieux. Un regex dans votre éditeur peut vous aider : recherchez les motifs sans heures ou sans point, puis remplacez en masse. Sinon, des outils automatiques comme nettoyage des timestamps en un clic peuvent rectifier majuscules, ponctuation et écarts de temps sans altérer le texte.


Importer des transcriptions et caler les horodatages

Les transcriptions automatiques souffrent souvent de mauvaises segmentations, d’absence de précision au milliseconde ou d’usage de virgules plutôt que de points. Les aligner manuellement à l’audio revient à couper le texte en blocs courts et lisibles, et à leur attribuer des horaires précis.

Alignement manuel

  1. Lisez votre média dans un lecteur permettant le retour en arrière ou le ralenti.
  2. Notez l’heure exacte au moment où chaque bloc parlé commence.
  3. Entrez les horodatages formatés dans votre fichier VTT, en ajustant les millisecondes pour améliorer la synchronisation.

Alignement assisté

Les transcriptions générées via des outils conformes détectent les locuteurs et ajoutent des horodatages précis, réduisant considérablement le travail. Cela évite de devoir tout réécrire parce que des sous-titres auto-importés ne passent pas la validation. Avec la re-segmentation automatique (très utile pour des interviews), on peut réorganiser entièrement une transcription pour en faire des sous-titres en quelques secondes, idéal pour constituer rapidement un VTT à partir de longs enregistrements.


Checklist rapide de QA avant mise en ligne

Avant de télécharger votre fichier VTT sur une plateforme ou un CMS, faites une revue qualité finale :

  1. Encodage : Vérifiez l’UTF-8 sans BOM pour garantir le support des caractères multilingues.
  2. Syntaxe : Chaque cue est séparé par une ligne vide ; espaces bien placés autour de --> ; millisecondes renseignées.
  3. Timing : Les fins sont toujours après les débuts ; pas de chevauchement, sauf pour les chapitres.
  4. Formatage : Aucun --> parasite dans le texte ; contenu exempt d’artefacts de sous-titres auto-générés.
  5. Test MIME : Hébergez le fichier et testez-le dans une balise <track> HTML5 pour vérifier la lecture dans le navigateur.

Cette checklist permet d’éviter les refus frustrants au moment de la mise en ligne.


Conclusion

Le format VTT offre une solution nette et précise pour fournir sous-titres, légendes et autres pistes texte synchronisées pour la vidéo. En maîtrisant sa structure, en gérant correctement l’encodage UTF-8 et en restant attentif aux pièges des horodatages, vous pourrez produire des fichiers conformes, validés instantanément sur la plupart des plateformes.

Que vous composiez vos cues à partir de zéro ou que vous adaptiez une transcription automatique, l’essentiel est d’allier rigueur technique et méthode efficace. Utiliser la génération de transcription structurée, le nettoyage instantané et l’alignement automatique des cues avec un outil comme SkyScribe réduit fortement le risque d’erreurs et le temps de traitement.

Au final, un fichier VTT propre et valide ne sert pas uniquement la conformité : c’est aussi un atout pour l’accessibilité, l’engagement du public et la qualité professionnelle.


FAQ

1. Quelle est la différence entre un fichier VTT et SRT ?
Le VTT utilise une précision au milliseconde avec des points (hh:mm:ss.mmm), des IDs de cue optionnels, et permet le style inline et les métadonnées. Le SRT utilise des virgules pour les millisecondes et des numéros de séquence.

2. Les fichiers VTT doivent-ils être en UTF-8 ?
Oui. La spécification officielle impose l’UTF-8 pour prendre en charge des sous-titres multilingues. L’UTF-8 sans BOM reste le choix le plus sûr pour une compatibilité maximale.

3. Pourquoi mes sous-titres VTT disparaissent-ils en cours de lecture ?
Probablement à cause d’horodatages qui se chevauchent ou d’une syntaxe invalide, comme l’absence d’espace autour de -->.

4. Peut-on convertir facilement un SRT en VTT ?
Oui, en remplaçant les virgules par des points dans les timestamps, en supprimant les numéros de séquence et en s’assurant de l’encodage UTF-8. Des scripts ou des regex peuvent automatiser cette conversion.

5. Comment vérifier qu’un VTT est valide ?
Testez-le dans une balise <track> HTML5 et lisez-le pour contrôler la synchronisation. Utilisez aussi des validateurs ou des lecteurs exigeants comme JW Player pour repérer tout format non conforme.

Agent CTA Background

Commencez une transcription simplifiée

Plan gratuit disponibleAucune carte requise