Table of Contents
  1. Historique d’une boulimie de données
  2. Derrière la donnée : l’énergie
  3. Comparaison article / podcast / vidéo
    1. Taille moyenne d'un script de 1500 mots selon son format
    2. Puissance électrique par type de lecture
  4. Le bon medium pour le bon usage
  5. La vidéo quand vous n’avez pas le choix
  6. Consommer de la vidéo avec discernement

#Historique d’une boulimie de données

Au début du web était la page HTML, formant un site dit « statique » au sens où, à la manière d’un journal, le contenu était figé. De tels sites s’éditaient soit à la main, dans un éditeur de texte, soit avec des logiciels de mise en page, très similaires à ce que Microsoft Word propose. Il fallait éditer les liens, les menus, les sommaires et la page d’accueil à la main. C’était compliqué.

Les logiciels de gestion de contenu (Drupal, Joomla, WordPress, Spip, etc.), utilisant des bases de données et des gabarits de mise en forme (programmés) ont rendu le processus d’édition-rédaction infiniment plus simple en permettant de rédiger des publications qui possèdent toutes la même mise en forme, dictée par le gabarit. Le rédacteur n’avait alors plus à s’embêter à mettre à jour les liens, la page d’accueil etc. à la main : il pouvait se contenter de rédiger le contenu, le reste (mise en page et liens internes) était fait par le logiciel.

Ainsi est né le blog : d’une possibilité technique. Le blog est devenu ce qu’on pourrait appeler une forme littéraire numérique, développant peu à peu ses codes, mais sans préjuger de son usage. On trouve ainsi des blogs personnels, professionnels, à visée informative, récréative, créative, etc. Le blog, principalement textuel à la base, s’est ensuite diversifié avec le photo-blog. Une page de blog de base pèse quelques centaines de kilooctets. Une page de blog photo pèse quelques megaoctets.

L’arrivée des iPods et autres baladeurs MP3 au milieu des années 2000 a favorisé l’apparition des podcasts. Le podcast est un fichier sonore que l’on peut emporter sur son baladeur, souvent une captation d’émission, parfois une simple lecture de texte. De la même manière que le blog rendait tout le monde journaliste et/ou éditorialiste, le podcast rendait tout le monde animateur radio. D’un point de vue technique, le podcast (généralement en MP3), pèse de 0.9 à 1.4 megaoctet par minute.

Puis YouTube est arrivé, et avec lui, la possibilité pour chacun de devenir un présentateur/réalisateur TV avec son ordinateur et sa caméra. Cette liberté a vu tous les usages exploser : vidéos documentaires, tutoriaux, cours, essais de produits, fiction, humour, lolcats et le vlog. Mi-journal intime, mi-chronique régulière, le vlog est un peu la téléréalité démocratisée, où l’on invite l’internaute dans sa vie, pour un divertissement facile à consommer. L’usage du son et de l’image permet une relation plus naturelle et personnelle entre le vlogger et son publique que n’ont pu le faire le blog et le podcast. Mais voilà, la vidéo haute définition pèse minimum 1 megaoctet par seconde.

#Derrière la donnée : l’énergie

Le problème, c’est que chaque octet qui transite coûte cher à la planète, en terme d’énergie et donc de pollution (émission de carbone, notamment). Jusqu’à récemment, les serveurs de tous les géants du web se trouvaient en Californie du Nord, un État américain où l’énergie est particulièrement bon marché car tirée de centrales à charbon, un charbon extrait localement en décapant littéralement des montagnes entières. En 2014, Google tirait 5 % de la production d’énergie de Caroline du Nord, autant que la ville de Bordeaux.

Ça ne s’arrange pas avec l’explosion de la consommation de vidéo par internet : chaque minute, 72h de vidéo sont mises en ligne sur Youtube et, chaque jour, 500 millions d’heures sont visionnées. On estime ainsi que les seuls utilisateurs américains crééent plus de contenu en 30 jours que toutes les chaînes de TV américaines depuis 30 ans. Cisco estime aussi que, d’ici 2021, ce seront 17000 h de vidéos cumulées qui transiteront chaque seconde sur le réseau internet. En 2011, Google affirmait que chaque 10 min de vidéo visionnée coûtait 1 g de CO2. C’était avant l’ultra-haute définition (4 K). En 2017, on parle alors de 83 tonnes de CO2 par jour, juste pour YouTube, en supposant que 1 g CO2/10 min soit toujours d’actualité.

Les recherches continuent activement pour créer des formats d’encodage des vidéos toujours plus efficaces et comprimés, de façon à réduire la bande passante consommée, aussi bien du côté des serveurs que de celui des fournisseurs d’accès. Le problème, c’est que plus l’encodage est agressif, moins le fichier vidéo pèse lourd mais plus l’ordinateur qui va lire la vidéo va devoir travailler pour décoder le flux vidéo. Donc ce qui est économisé pendant le trajet et au moins partiellement perdu chez le spectateur, au niveau du processeur.

#Comparaison article / podcast / vidéo

Soit un article de 1500 mots, une longueur assez classique quand on produit de l’analyse, et ma longueur d’article moyenne (cet article fait 1433 mots). Une telle page, sur ce site, pèse 3.3 Mo. En réalité, sur ces 3.3 Mo, 2.62 Mo sont des ressources statiques (feuilles de styles, programmes et polices) qui ne sont chargées qu’une fois, à la première visite, puis sont gardées en cache dans le navigateur par la suite et pas rechargées à chaque nouvelle page. Comme si vous téléchargiez une application mobile, en fait. Le contenu de l’article en lui-même (texte et images), pèse 725 ko.

Imaginons qu’on produise le même article sous forme multimédia, en le lisant à voix haute. On prononce le français en moyenne à 150 mots par minute, ça fait 10 min de lecture pour notre article de 1500 mots. Enregistré en MP3 à 128 kb/s, le podcast pèse alors 9.15 Mo. En lisant face caméra, la vidéo en MP4/H264/AAC en full HD à 25-30 image/s (le standard recommandé par Youtube) pèse alors 628 Mo.

#Taille moyenne d'un script de 1500 mots selon son format

Mesurons maintenant la puissance électrique consommée par un ordinateur pour afficher chacun de ces contenus sur un ordinateur. Les tests sont réalisés sur un ordinateur portable récent, écran 4 K 15.6 pouces, avec la fréquence processeur forcée au minimum (800 MHz) et le rétro-éclairage de l’écran à 10 %. Le système d’exploitation est Linux Ubuntu 18.04, le navigateur internet utilisé pour lire l’article et les vidéos est Firefox 60 avec 7 cœurs et l’accélération matérielle activée. On mesure la consommation sur batterie avec l’outil Intel Powertop. La consommation de base du système allumé mais inactif est 6.35 W en moyenne (on allume l’ordinateur, on le laisse tourner sans rien faire 10 min, et on mesure la décharge de la batterie).

Le podcast et la vidéo de test sont une interview de la chaîne Thinkerview, qui réalise des entretiens oraux très peu visuels et propose à la fois des vidéos Full HD et des podcasts MP3. La lecture et le téléchargement sont effectués en simultané via le réseau wifi.

#Puissance électrique par type de lecture

En conclusion, on observe, entre le texte et la vidéo, une augmentation de la taille de 190 fois et une augmentation de la puissance électrique consommée de 1.6 fois. Entre le podcast et la vidéo, la taille augmente 68 fois et la puissance électrique 1.22 fois. En gros, une minute de podcast pèse aussi lourd qu’une seconde de vidéo HD 1080p.

#Le bon medium pour le bon usage

Devant la différence de taille et de ressources consommées, pour un même contenu, en fonction du format utilisé, il apparaît urgent de se demander si le support qu’on utilise est adapté et rationnel.

La vidéo offre une possibilité unique de montrer des éléments graphiques pendant qu’on fournit une explication verbale. Les tutoriaux de nature artisanale, présentant des savoirs-faire techniques, semblent difficiles à réaliser avec la même qualité sous forme de texte ou en podcast. Mais il n’est peut-être pas utile de les filmer en 60 images/s. Pour des captures d’écran (tutoriaux sur un logiciel), 10 images/s suffisent largement.

En revanche, les vidéos de type éditorial, avec un orateur qui s’exprime en face de la caméra ou avec un entretien verbal, sans support graphique, pourraient facilement être converties en podcasts, pour diviser la bande passante consommée par 68 et la puissance demandée par 1.22. Avec un peu plus d’effort, on pourrait simplement les rédiger sous forme de texte, ce qui améliore leur indexabilité dans les moteurs de recherche et la possibilité d’en extraire des mots-clés, pour diviser la bande passante requise par 190 et la puissance demandée par 1.6.

Cependant, la mode actuelle consiste à faire des vidéos coûte que coûte, d’abord pour viser le public de YouTube, qui ne fréquente pas forcément les blogs, et ensuite car ce type de contenu facile à consommer est plus prisé et demande moins d’effort que la lecture de texte.

De plus, de nombreux utilisateurs jouent les vidéos en arrière-plan, en écoutant le son mais sans regarder l’image. Ces utilisateurs encombrent inutilement le réseau tout en consommant de l’énergie pour rien.

De plus en plus de photographes passent à la vidéo, pour partager des astuces, des réflexions, mais aussi pour accroître leur visibilité et toucher le public présent sur YouTube. Il convient de se demander si la vidéo apporte bien quelque chose à leur message, et si ce n’est pas juste une dépense superflue d’énergie. YouTube, qui propose déjà plusieurs options de visionnement (résolutions variées, 3D stéréoscopique, sous-titres, etc.) devrait aussi proposer une option MP3/son uniquement, de façon à ne pas transmettre l’image à ceux qui ne l’utilisent pas.

Internet n’est pas gratuit : il pollue et consomme de l’énergie. Il est de notre responsabilité de créateurs et d’utilisateurs de l’utiliser intelligemment, et avec parcimonie.

#La vidéo quand vous n’avez pas le choix

Si vous n’avez pas le choix de passer par la vidéo pour transmettre votre message, voici quelques conseil pour diminuer votre empreinte carbone :

  1. Enregistrez en mono : les gens associent “mono” avec “faible qualité audio”, alors que ça n’a rien à voir. Un vrai enregistrement stéréo suppose d’enregistrer avec au moins deux micros, qui pointent dans deux directions légèrement différentes pour créer une spatialisation du son (comme les oreilles). Si vous n’enregistrez qu’une voix avec un seul micro, enregistrez en mono. Si vous forcez votre enregistreur en stéréo alors que vous n’utilisez qu’un seul micro, il va seulement dupliquer l’entrée mono sur chaque canal gauche/droite stéréo, ce qui va multiplier le poids de la bande son par deux sans apporter de supplément de qualité. N’importe quel lecteur stéréo qui reçoit un signal mono est déjà capable de dupliquer le signal sur chaque canal gauche/droite, inutile donc de charger la vidéo pour rien.
  2. Limitez la résolution au strict minimum : suivant ce que vous montrez, il peut être suffisant d’enregistrer en HD 720p. Pour de l’enregistrement d’écran (screencast), le HD 1080p est amplement suffisant. Si vous enregistrez la narration par dessus un diaporama (type Office PowerPoint), il peut être utile d’éviter de faire une vraie vidéo, mais simplement un enregistrement sonore synchronisé avec la séquence d’images statiques du diaporama. On enregistre alors une seule image par diapositive (au lieu de 25 à 60 images/seconde pour une vraie vidéo), et on recale son et image via des codes temporaux, à la façon des sous-titres. Ceci est permis par PowerPoint.
  3. Limitez la fréquence d’image au strict minimum : là encore, 50 ou 60 images/seconde sont totalement inutiles dans 99 % dans cas. Pour de la capture d’écran (screencast), vous pouvez descendre à 10 images/seconde sans que personne ne voit la différence (étant donné qu’un écran est la plupart du temps statique).
  4. Misez sur la qualité audio : les spectateurs sont beaucoup plus tolérants envers une image pas trop nette qu’envers une bande son dégradée. Sachant que le son est la partie la plus légère de la vidéo, mettez le paquet sur la qualité sonore et faites le minimum pour la vidéo.

#Consommer de la vidéo avec discernement

J’ai testé Youtube sur un écran 4 K de 15,6 pouces, et je suis incapable de voir une différence entre de la HD 4 K et de la HD 1080p. La raison est probablement que, à 25-30 images par secondes, les images défilent trop vite pour qu’on ait le temps d’apprécier leur netteté spatiale, et le cerveau fabrique une sorte de moyenne floue, spatiale et temporelle, des pixels.

J’utilise une extension pour Firefox, Enhancer for Youtube, configurée pour charger toutes les vidéos Youtube en résolution 720p par défaut. Dans les rares cas où ça ne suffit pas (généralement, pour des captures d’écran de logiciel où le texte est important), je passe en 1080p, mais ça m’arrive moins d’une fois par mois. Un flux vidéo HD 720p pèse 1.6 fois moins lourd que du HD 1080p, et 7 à 9 fois moins lourd que du HD 4 K.