Lorsqu'un utilisateur réalise un test vidéo, la qualité de la prise de son dépend directement du matériel (hardware) utilisé pour le test ainsi que des conditions extérieures (proximité du testeur avec le micro, bruits de fond, timbre de la voix, …). Par conséquent, il est impossible d’obtenir un rendu sonore standardisé directement en sortie d’enregistrement, identique pour tous les utilisateurs. De plus, le format d’encodage des vidéos peut également différer d’un support à un autre (iOS, Android, Desktop).

Une phase de pré-traitement des données audio/vidéo est donc essentielle avant le visionnage de la vidéo par le client ou nos experts UX, pour que ces derniers bénéficient d’une écoute stable et confortable pendant la phase d’analyse des résultats des tests.

L'intérêt est ici d'obtenir une série de vidéos, générées lors de nos tests utilisateurs distants, avec un volume sonore homogène et normalisé pour un meilleur confort d'écoute pour l'ensemble de nos clients.

Pour l’heure, nos efforts se sont concentrés autour de 3 objectifs :

  • la standardisation du format d’encodage audio/vidéo pour tous les supports,
  • la normalisation du volume d’écoute pour éviter de constamment réajuster le bouton de volume pendant le visionnage,
  • la détection et l’atténuation des pics de volume “parasites” qui nuisent à l’écoute, provoquent des sursauts d’amplitude sonore et faussent les calculs de normalisation du volume.

Normalisation du son

Standardisation du format d’encodage audio/vidéo

La standardisation de la norme d’encodage est plutôt simple et se base sur des outils logiciels existants qui permettent en un tour de main de décoder et ré-encoder (presque) n’importe quel fichier audio/vidéo dans n’importe quel format !

Les vidéos ainsi ré-encodées assurent une compatibilité parfaite avec la plupart des lecteurs vidéo et permettent un suivi des bugs beaucoup plus rapide lorsqu’une vidéo subit des dommages lors de l’enregistrement.

Normalisation du volume d’écoute

L’idée est ici d’appliquer un facteur de normalisation à l’ensemble de la forme d’onde pour amener le son à un volume d’écoute raisonnable pour l’oreille humaine.

La procédure classique consiste à repérer le pic de volume le plus élevé dans la forme d’onde, de calculer le facteur multiplicatif qui permet de faire passer ce pic à une amplitude de référence (généralement -3 décibels) puis d’appliquer ce même facteur multiplicatif à l’ensemble de la forme d’onde. Le principe est illustré ci-dessous (les lignes en pointillé représentent l’amplitude audio de référence à atteindre) :

Néanmoins cette méthode possède une importante limitation : si un pic “parasite” irrégulier et de forte amplitude se manifeste dans la forme d’onde (l’utilisateur éternue ou parle soudainement trop près du micro, par exemple), ce dernier servira d’amplitude de référence ce qui biaise l’ensemble du processus de normalisation.

Ce cas de figure se produit très souvent avec les micros embarqués dans nos ordinateurs, smartphones ou tablettes, et par conséquent affecte la majorité des vidéos de tests utilisateurs collectées chez Testapic.

La figure ci-dessous illustre le problème avec une forme d’onde usuelle extraite de nos données :

Dans la seconde partie, nous verrons comment détecter et atténuer les pics de volume parasites.

Publié par : - Classés dans : Testapic News