La lutte contre la diffusion de contenus haineux demande des outils beaucoup plus performants. © Victor Moussa, Fotolia

Contenus haineux sur Internet : les IA qui les traquent sont faciles à tromper

Intelligence artificielle

Internet

Tech

Facebook

Google

actualité

• 2 Min

Selon une étude réalisée par des chercheurs de l'université Aalto (Finlande), les principaux outils de détection de contenus haineux utilisés par les sites Web peuvent être très facilement contournés en jouant simplement sur la typographie et l'orthographe.

au sommaire

Les contenus dits « toxiques », à caractère haineux, font l'objet d'une chasse permanente de la part des réseaux sociauxréseaux sociaux et d'autres grandes plateformes Web. Face à des pratiques qui virent souvent au cyber-harcèlement, les géants de l'Internet tels que FacebookFacebook, GoogleGoogle, TwitterTwitter, Reddit et consorts ont développé ou adopté des outils de détection basés sur l'intelligence artificielle, et, plus spécifiquement, sur l'apprentissage automatique (machine learning), qui sont censés faciliter le travail des modérateurs.

Cependant, une étude menée par une équipe de l'université Aalto, en Finlande, révèle que ces dispositifs sont en réalité très faciles à duper. Dans leur article scientifique, les chercheurs expliquent qu'ils ont testé les sept principaux logiciels de détection de contenus haineux. Tous ont échoué face à des ruses assez basiques consistant à altérer les termes par des fautes d'orthographe ou de grammaire. Autrement dit, quelques légères modifications peuvent suffire à passer à travers les mailles du filet.

Améliorer la qualité des données d’entraînement des algorithmes

Les chercheurs pointent en particulier le cas de Google Perspective. Cette interface de programmation (API, pour ApplicationApplication Programming Interface en anglais) introduite l'année dernière est un outil de détection automatique des contenus toxiques basé sur l'apprentissage automatique qui s'adresse aux éditeurs de sites Web. Des sites comme Wikipédia, The New York Times ou The Guardian le testent. À l'époque, il avait été rapidement constaté que de simples fautes d'orthographe suffisaient à leurrer le système. Depuis, Google a travaillé pour corriger ce défaut. Mais les chercheurs de l'université Aalto ont constaté que d'autres subterfuges tels que la suppression des espaces entre les mots ou l'ajout d'un terme inoffensif fonctionnaient toujours.

Par exemple, il suffit d'ajouter le mot « love » (« amour » en anglais) à « Ihateyou » (« je te déteste ») pour berner Perspective. Dans leur conclusion, les chercheurs estiment que les efforts devraient porter non pas sur le design des algorithmes mais sur les données qui sont utilisées pour entraîner ceux-ci. Et, selon eux, un système basé sur la détection des caractères individuels serait potentiellement plus efficace.

par Marc Zaffagni

Journaliste

le 17 septembre 2018

Nos articles

à lire aussi

Google Dataset Search indexe les bases de données scientifiques et publiques open source. © bluebay2014, Fotolia

Tech

Moteur de recherche

Dataset Search, le moteur de recherche de Google pour les données scientifiques

actualité

• 11/09/2018

Dans le futur, les robots et les ordinateurs pourraient apprendre à mieux nous connaître en analysant notre regard. © Pixelaway, Fotolia

Tech

Intelligence artificielle

Cette IA peut cerner votre personnalité rien qu'en regardant vos yeux

actualité

• 31/07/2018

Tech

Robotique

La robotique de A à Z

dossier

• 19/02/2018

Comme Facebook, Twitter propose par défaut la lecture automatique des vidéos publiées dans le fil d’actualité. © Andy Melton, Wikimedia Commons, CC by-sa 2.0

Tech

Internet

Désactiver la lecture automatique des vidéos sur Twitter

question réponse

• 03/01/2016

Facebook de part le monde. © Edar - Domaine public

Tech

Informatique

Comprendre Facebook

dossier

• 25/10/2011

Il est possible de désactiver la lecture automatique des vidéos Facebook. © bykst, Pixabay, DP

Tech

Internet

Désactiver la lecture automatique des vidéos sur Facebook

question réponse

• 02/01/2016

Tech

Intelligence artificielle

Intelligence artificielle : ces pionniers qui ont révolutionné l'IA

question réponse

• 21/02/2024

Comment continuer à voir les publications de Futura sur Facebook ? © StockRocket, fotolia

Tech

Internet

Algorithme Facebook : comment continuer à voir les contenus Futura ?

question réponse

• 01/03/2018

Tech

Informatique

De Google Earth à Géoportail 3D

dossier

• 03/07/2006

Internet 2, le Web de demain. © Geralt - Domaine public - Markus Angermeier - CC BY-SA 3.0

Tech

Télécoms

Internet 2, le Web de demain

dossier

• 20/11/2005

Tech

Intelligence artificielle

Google veut humaniser l'intelligence artificielle

actualité

• 11/07/2017

Tech

Robotique

L'intelligence artificielle pose cinq problèmes de sécurité selon Google

actualité

• 28/06/2016

Facebook a choisi la capitale française pour installer son troisième centre de R&D consacré à l’intelligence artificielle. Trois chercheurs français ont été recrutés à cette occasion. © A Health Blog, Flickr, CC by-sa 2.0

Tech

Technologie

Intelligence artificielle : Facebook ouvre un laboratoire en France

actualité

• 07/06/2015

Tech

Intelligence artificielle

Une intelligence artificielle peut apprendre une langue sans aide humaine

actualité

• 30/11/2017

À l’instar de Microsoft et Google, Facebook a beaucoup investi dans la recherche et le développement sur l’intelligence artificielle. Le réseau social ambitionne de créer un assistant virtuel doté de sa propre intelligence, capable de comprendre un humain en dialoguant avec lui de façon naturelle. © via Pixabay, DP

Tech

Technologie

Intelligence artificielle : les ambitieux projets de Facebook

actualité

• 05/07/2015

La sélection de la

Rédaction

Plusieurs sites se sont développés pour soutenir les agriculteurs et une alimentation plus saine. © Image de Freepik

Tech

Jeunes Pousses

11 sites pour manger plus sainement et soutenir les producteurs locaux

Article

Une photo d'une jeune femme souriante a été altérée par un dessinateur pour donner l'impression qu'elle tient une arme (crayonnée sur la photo). © Dall.E

Tech

Netflix utilise en secret des images générées par IA dans ses documentaires

Article

La précarité menstruelle concerne entre 1,5 et 2 millions de femmes. © Nenetus, Adobe Stock

Tech

Jeunes Pousses

Lutte contre la précarité menstruelle : Marguerite & Cie en première ligne

Article

Avec son réseau de voisins-relais, Pickme permet de réduire les 20 % d’échecs à la première livraison. © Pickme

Tech

Jeunes Pousses

Les voisins-relais, la bonne idée pour réduire les échecs de livraison

Article

40 % des aides ne sont pas réclamées en France ! Klaro a créé une application destinée à faciliter l’accès aux aides. © peopleimages.com, Adobe Stock

Tech

Jeunes Pousses

Ne passez plus à côté des aides auxquelles vous avez droit grâce à cette appli

Article

L’intelligence organoïde, promesse ou utopie ?

Tech

Intelligence artificielle

L’intelligence organoïde, promesse ou utopie ?

Article

Tech

Voiture

Renault Group accélère sur les pièces reconditionnées pour les voitures électriques

Article

100 millions de lunettes dorment au fond des tiroirs des Français. © Vecstock, Freepik

Tech

Jeunes Pousses

Cette startup française change la vision du monde avec des lunettes recyclées à petits prix !

Article

À voir aussi

tromper etudes

tromper alcotest

devinettes faciles

enigmes tres faciles

petites devinettes faciles

experiences chimiques faciles

montages electroniques faciles

Mots Clés

Apprentissage automatique

Google Perspective

Contenus haineux

Contenus toxiques

Twitter

New-York Times

Wikipédia

The Guardian