GPT-2 : le Saint Grâle des trolls

Avec l’arrivée de cette nouvelle intelligence artificielle, l’action des trolls, déjà assez agaçante sur la toile pourrait connaitre un nouvel essor et passer à un tout autre niveau bien supérieur à ce qu’on connait actuellement.

Pour ceux qui ne comprennent pas encore bien ce que c’est, un Troll est de manière basique une personne qui malencontreusement ou intentionnellement poste un message sur une publication sans avoir pris connaissance du sujet redirigeant ainsi les commentaires vers un contexte autre que celui de la publication.


OpenAI  l’institut de recherche dans lequel Microsoft a dernièrement injecté un (01) milliard d’euros en investissement, a récemment mis en ligne la version complète de GPT-2. GPT-2 est une intelligence artificielle dont le but est de produire un texte intelligible en partant juste de quelques mots (d’une petite phrase). La qualité du texte produit est presque équivalente aux textes humains.

La capacité qu’a GPT-2 de pouvoir créer des textes à partir d’un minimum de mots ou d’une phrase farfelue est tout simplement incroyable. Mais en revanche il faut s’attendre de temps en temps à des loupés (phrases dénuées de sens) et répétitions de mots. Suite à une étude menée par l’Université de Cornell, GPT-2 a obtenu une note de 6,91/10. Les textes fournis par cette intelligence artificielle sont donc d’une précision semblable à celle d’une « personne physique ». Il suffit de voir ce cas de figure que nous avons effectué sur le site talktotransformer.com qui propose une implémentation web de cette IA. A l’aide juste de quatre (04) lettres (HTML) nous avons obtenu tout un texte. Et si le texte ne nous convient pas on peut générer à nouveau un autre texte.

Texte obtenu à partir du mot HTML grâce à l'intelligence artificielle
Texte obtenu à partir du mot HTML

Le 14 Février 2019, un nouveau model linguistique d’OpenAI est suffisamment bon pour écrire des histoires ; générer des nouvelles (fausses) et même rédigé des manifestes anti-recyclage. Et c’est à ce moment qu’on lui attribue le nom de « OpenAI GPT-2 ». Cette version bridée compte 124 millions de paramètres ; en mai et en août dernier, d’autres versions moins bridées sortirent et eûrent respectivement 355 et 774 millions de paramètres.

Qu’est ce qui se cache derrière cette capacité folle qu’a cette nouvelle itération a pouvoir produire d’aussi bons textes en partant de rien ?


Eh bien contrairement à ce qu’on pensait, il n’y a pas eu d’évolution palpable coté algorithmique, juste une toute petite astuce : l’augmentation très très considérable du nombre de paramètres par les chercheurs de OpenAI. En effet GPT-2 compte environ 1,5 milliard de paramètres soit 15 fois plus que le GPT original (première version) ; ceci ajouté à un texte obtenu à partir des textes de 8 millions de sites internet.

Une autre version de GPT-2 a vu le jour cet été, elle possède plus de 8 milliards de paramètres. Une amélioration de la sensibilité du texte a noté.


Quand est-il de son utilisation à des fins malveillantes ?

La toile serait très prochainement être rempli de textes artificiels, issus des robots. Les trolls pourraient inonder le web et les réseaux sociaux. Ce serait la cata !!!

Imaginons un tant soit peu les entreprises à manipulation d’informations et influenceurs utiliser cette technologie en remplacement de leurs employés, on se pose alors la question de savoir quel serait la crédibilité des informations que nous consultons sur le net ?

D’après les chercheurs du Middlebury Institute Center of Terrorism, Extremism and Counterterrorism (CTEC) la précision de détection d’un texte synthétique est proche des 100%, donc les personnes malveillantes qui l’utiliseraient pourraient être facilement démaquées.


Néanmoins, la détection d’utilisateurs malveillants risque de devenir très difficile avec les itérations futures, car plus les paramètres sont grands plus la détection est difficile.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

1 × cinq =