Comment gérer des millions de publications quotidiennes sur les réseaux sociaux ? Si Facebook et consorts font appel à des armées de modérateurs, ils automatisent aussi de plus en plus le processus grâce à des algorithmes.
« Sujets dont la suppression doit être confirmée : (…) présence de parties intimes, incluant les tétons féminins et les raies des fesses. Les tétons masculins sont OK. (…) Les têtes ou membres écrasés sont OK, seulement si l’on n’en voit pas l’intérieur »
Inscrites dans un manuel dévoilé en 2012 par le site Gawker, ces consignes de Facebook présentaient ce que le réseau social souhaitait montrer ou cacher à ses utilisateurs à l’époque – elles ont pu évoluer depuis. Un livret à destination des quelques milliers de modérateurs qui, à travers le monde (et via des entreprises sous-traitantes), s’occupent de nettoyer la plateforme de tout contenu subversif signalé par les internautes. Et qui sont les témoins quotidiens de la diversité infinie de la débauche humaine déversée sur Facebook, au point que leur travail affecte bien souvent leur santé mentale, comme le montrait Wired dans une enquête datant de 2014.
Mais ce n’est pas pour le bien-être de ces employés, mais bien pour en améliorer l’efficacité que les compagnies de la Silicon Valley cherchent en parallèle à automatiser cette chasse aux contenus indésirables. Et font appel à des outils tels que ceux développés par Hany Farid. Soutenu par Microsoft, ce professeur à l’université de Dartmouth aux États-Unis a mis au point PhotoDNA en 2008.
Petit tutorial de ce logiciel, en anglais, qui explique que chaque photo a son propre ADN, ou signature digitale, et cet ADN permet de retrouver la même famille de photos et la photo originelle parmi les milliards existantes :
Microsoft utilise donc PhotoDNA pour éradiquer la multiplication des images pédophiles sur l’Internet.
À l’aide d’une base de données de fichiers censurés, cet algorithme identifie (et supprime) les images pédo-pornographiques parmi toutes les publications en ligne. Facebook, Google, Microsoft, de nombreuses applications et des plateformes de stockage cloud l’utilisent déjà.
« eGlyph », chasseur de pédophiles et de terroristes
Aujourd’hui, Hany Farid oriente ses recherches vers les publications terroristes. Il est à présent conseiller principal de l’organisation Counter Extremism Project – qui se revendique non-partisane bien que fondée par un proche de G. W. Bush. « Les extrémistes utilisent les plateformes en ligne comme des armes qui servent à radicaliser, recruter et inciter à la violence. C’est une excellente opportunité pour les entreprises de restreindre l’utilisation des réseaux sociaux à des fins funestes », explique-t-il à Télérama.
Dans ce but, il a développé l’algorithme eGlyph « qui permet de traiter les vidéos et les fichiers sonores aussi bien que les images ». « L’algorithme scanne des milliards de données publiées sur Internet et les réseaux sociaux chaque jour.
Lire la suite de l’article sur telerama.fr