Forum INCYBER 2026 La guerre au faux généré par IA est déclarée

Avec l’explosion de l’IA générative, le faux inonde la Toile. Un tsunami qui a des conséquences économiques, sociales, politiques… et bien sûr cyber. Comment s’y retrouver, faire face et rétablir un minimum de confiance ? Éléments de réponse sélectionnés dans plusieurs tables rondes du Forum INCYBER 2026.

« On a vraiment basculé dans une ère d’industrialisation de la tromperie », lance Jérôme Nevicato. La formule de ce lieutenant-colonel de réserve, affecté au COMCYBER-MI (Commandement du ministère de l’Intérieur dans le cyberespace), décrit bien le saut d’échelle auquel on assiste depuis le succès planétaire de l’IA générative. Comment dès lors « distinguer le vrai du faux », pour reprendre le titre de la table ronde à laquelle il participait lors du FIC 2026 ? Peut-on encore construire une confiance collective dans un environnement où une voix, une image, une vidéo ou même une preuve peuvent être fabriquées, altérées, amplifiées ou contestées à une échelle industrielle ?

L’ANSSI constate aussi une « massification de la menace » cyber. Elle ne permet pas seulement de fabriquer un faux convaincant, mais de produire des milliers de contenus, de les adapter, de les faire circuler, de les tester, de les corriger et de les relancer. Adel Mebarki, CIO de Foresight Data Agency, rappelle dans cette même table ronde qu’avant l’IA générative, les fermes à trolls reposaient sur « des personnes payées pour créer du contenu de manière manuelle ». Avec l’IA, désormais, « ça coûte très peu cher », c’est « assez simple techniquement et surtout, on peut créer des identités numériques crédibles », c’est-à-dire des comptes « 100 % fake », mais dotés d’un comportement numérique ressemblant à celui d’un humain. À la clef, des « manipulations d’informations sur les réseaux sociaux autour des sujets d’ingérence étrangère », mais aussi « beaucoup d’opérations de dénigrement économique ».

« Il ne s’agit pas de fact-checker avec l’IA »

Résultat ? Les défenseurs ne courent plus seulement derrière des mensonges, mais derrière une machine à produire du plausible. Adel Mebarki donne un exemple parlant : l’audio. Il y a un an, explique-t-il, il était difficile de donner des émotions fines à une piste audio artificielle. Aujourd’hui, on peut en injecter « à chaque phrase, à chaque mot, ce qui rend difficile pour l’IA en défense d’identifier que c’est du contenu généré ».

Andrew Dudfield, responsable IA chez Full Fact, une société de fact-checking basée au Royaume-Uni, et représentant du European Fact-Checking Standards Network, souligne la question de l’échelle : « Internet, c’est très grand, et ça, c’est un problème. » Et c’est là que l’IA vole au secours des fact-checkers. « Il ne s’agit pas de fact-checker avec l’IA, je ne pense pas que ça soit forcément une bonne idée », souligne-t-il lors de la table ronde « Sécuriser les faits à l’ère de l’IA générative », mais plutôt de la mettre au service des fact-checkers pour « comprendre ce qui se passe en ligne » et hiérarchiser les priorités.

En effet, selon Andrew Dudfield, le rôle du fact-checking consiste désormais à faire le tri dans un volume massif de contenus où tout n’est pas faux, généré par IA ou même nocif. Full Fact cherche ce qui peut provoquer un dommage concret : arrêter un traitement médical, changer son vote ou s’abstenir, acheter un produit ou y renoncer. C’est une réponse pragmatique, mais le « dommage » n’est pas une notion neutre. Si elle peut être assez claire dans le domaine de la santé, en politique, elle devient plus délicate à manier. Une information peut modifier un vote parce qu’elle est fausse, mais aussi parce qu’elle révèle un fait exact et dérangeant. Le fact-checking reste donc indispensable, à condition de ne pas tenter de neutraliser les effets politiques d’une vérité.

« Massification de l’ingénierie sociale »

On parle ici d’une technique encore artisanale, rendant d’autant plus évidente l’asymétrie économique entre la production de faux, de moins en moins chère, et sa rectification. L’IA aide pourtant à réduire cet écart. Selon Abhijnan Dasgupta, directeur de la pratique, confiance et sécurité, chez Everest Group, « si l’on considère les principales plateformes, en moyenne, 85 % de la modération de contenu est aujourd’hui automatisée ». Toutefois, cet intervenant lors de la table ronde « IA et intelligence humaine : un équilibre fragile pour modérer le numérique » souligne qu’il « faut vraiment distinguer ce qui est automatisé de ce qui ne l’est pas ». Les cas simples peuvent atteindre, « 95 à 99 % » d’automatisation, tandis que les cas de complexité moyenne ou élevée tombent à 40 %, voire moins de 20 %. Une modération humaine qui aurait coûté « 10 milliards de dollars » dans le monde l’an dernier, affirme encore Abhijnan Dasgupta.

Et ce n’est qu’une partie du coût du faux contenu : objet médiatique, il devient aussi un outil cyber. Hugo Mania, chef de projet IA à l’ANSSI, souligne que les IA deviennent elles-mêmes des surfaces d’attaque : empoisonnement des données d’entraînement, extraction de données sensibles ou de propriété intellectuelle, attaques par évasion destinées à provoquer des comportements indésirables du modèle. Et encore, le FIC 2026 s’est tenu avant la sortie de Claude Mythos… Hugo Mania insiste aussi, dans la table ronde « Traçabilité et authenticité des contenus générés : distinguer le vrai du faux », sur la « massification de l’ingénierie sociale » : l’IA permet de rechercher plus finement des cibles en source ouverte et d’amplifier les méthodes d’attaque. C’est le point de jonction entre désinformation et cybersécurité. De faux profils LinkedIn, des messages vocaux, des notes internes, des vidéos de dirigeant ou de faux chatbots sont autant de vecteurs d’intrusion.

« Auditer la confidentialité des modèles »

Si l’ANSSI n’a pas de baguette – ou d’IA – magique, l’agence veut notamment être capable de « coter » ces attaques selon leur difficulté, l’expertise technique ou le matériel requis, leur coût… afin de bâtir « un schéma […] pour évaluer la confiance de vos solutions ». L’ANSSI travaille aussi sur PANAM (Privacy Auditing of High Models), une librairie qui « vise un certain nombre d’attaques d’extraction pour auditer la confidentialité des modèles ». La confiance se bâtit donc dès les couches basses : données, modèles, API, connecteurs, agents et identités non humaines…

Joel-Oskar Raisanen, directeur chez DTCP Growth, pointe précisément ce dernier enjeu. Les « identités non humaines sont importantes et vont le devenir encore plus à l’avenir ». Si un agent IA demande une action, encore faut-il être certain qu’il est légitime. « Il faut protéger les systèmes IA existants, les pipelines de données, les logs et les infrastructures qui les entourent ». Cette remarque technique annonce une mutation profonde : demain, la question ne sera plus seulement « qui a dit cela ? », mais « quel agent l’a produit, avec quelle autorisation, dans quel système, avec quelles traces ? » Dans une entreprise, un contenu sûr sera aussi un contenu relié à une identité machine fiable.

Reste la tentation technique : marquer, tracer, détecter. Anthony Level, cofondateur de la société Label4AI, définit le watermarking comme « un identifiant profondément intégré au contenu, que vous ne pouvez extraire que si vous disposez d’un algorithme secret ». De quoi répondre à l’IA Act, dont l’article 50 impose des obligations de transparence pour certains systèmes d’IA et prévoit le marquage des contenus synthétiques. Il ne vend pourtant pas le filigrane numérique comme une solution miracle.

Expertiser chaque contenu comme une scène de crime ?

Le watermark est-il sûr, c’est-à-dire « qu’il ne peut être supprimé ou imité » – donc potentiellement dangereux – et robuste, donc qu’il « résiste à la compression, aux captures d’écran, au recadrage ou au redimensionnement » – donc potentiellement inutile – ? Impossible de le garantir à 100 %.

Jérôme Nevicato, de son côté, rappelle que le C2PA, qui vise à certifier la source et l’historique des médias numériques, fonctionne bien « en théorie », mais que les métadonnées peuvent disparaître lors d’un téléchargement sur un réseau social ou d’une compression. Sa conclusion est pragmatique : combiner watermarking et C2PA, tout en gardant à l’esprit que « le watermarking peut être hyper attaqué ».

Le talon d’Achille reste l’open source et les modèles locaux. Adel Mebarki estime que « la majorité des deepfake vidéos dans des opérations informationnelles sont issus de modèles open source ». Dans ce cas, les mécanismes de watermarking sont contournés « by design », puisque les acteurs réentraînent leurs propres modèles et fixent « leurs propres règles, ce qui complexifie drastiquement la traçabilité ». La réglementation discipline les acteurs visibles, pas un acteur clandestin utilisant un modèle local modifié. D’où l’importance du forensic, qu’Anthony Level décrit comme une investigation dans le contenu lui-même, à la recherche de traces, de signaux faibles ou de signatures de modèles de diffusion.

On ne peut pourtant pas expertiser chaque contenu comme une scène de crime. Dans la table ronde « modérer le numérique », Lucile Bak, Chief Trust and Safety Officer de Dailymotion, remet les pieds sur Terre : « L’IA est désormais indispensable. Sans elle, il est impossible d’assurer une modération à grande échelle ».

« Le jeu pile ou face permet d’identifier plus facilement un deepfake que l’œil humain »

Les empreintes numériques et bases de hachage sont efficaces pour le copyright ou les contenus terroristes, mais sur des médias déjà identifiés, souligne-t-elle. Pour les contenus nouveaux, les outils repèrent des signaux, mais restent faibles sur « le contexte et l’intention qui sous-tend le contenu », ce qui génère faux positifs et faux négatifs. « La difficulté ne réside pas dans la création des outils, mais dans le fait de savoir quand leur faire confiance », souligne-t-elle. Chez Dailymotion, l’IA trie et l’humain tranche les cas délicats « car il maîtrise le contexte, il sait déceler les intentions et il est capable de comprendre les différences culturelles ». « S’agit-il de satire ou d’insulte ? C’est important. Les êtres humains ont donc leur importance », confirme Akash Pugalia, Chief Digital Officer de TP.

La partie humaine est pourtant la plus fragile, car l’IA générative attaque notre réflexe de confiance. Jérôme Nevicato affirme que « face à une vidéo deepfake de qualité, la probabilité d’identifier le faux est autour de 25 % », si bien que « le jeu pile ou face permet d’identifier plus facilement un deepfake que l’œil humain ». Une faille cognitive qui s’applique à tous les contenus. En cause notamment, la perte de repères communs pour définir le vrai. Avec « les dictionnaires, les encyclopédies, on avait des bases de connaissances sûres », souligne Emilia Tantar, directrice de l’IA et responsable de la Cybersecurity Factory de Luxembourg. Ce n’est plus le cas dans un monde où chacun se construit sa « vérité », en silo.

Le dividende du menteur

Face à ce manque criant, la Maison luxembourgeoise de la cybersécurité tente de créer « une base de données ouverte sur la cybersécurité, un espace commun qui suit les bonnes pratiques ». Une démarche collaborative qui permet « d’avoir au moins trois repères différents pour vérifier si notre perspective est valide dans un contexte plus général ».

Une démarche cyber qui gagnerait à être transposée dans le monde politique, tant l’IA peut en fausser le jeu, notamment avec le dividende du menteur. « Une chose qui s’est réellement passée peut être présentée par la personne mise en cause comme étant générée par l’IA, puisque maintenant, on n’arrive plus à distinguer le vrai du faux », explique Jérôme Nevicato. Le faux ne sert donc pas seulement à faire croire à un événement inventé, mais aussi à faire douter d’un événement réel.

Face à cette déferlante de faux qui bouscule profondément nos repères et fragilise nos infrastructures, il n’existe pas de réponse unique “Sécuriser” quand on le peut, contextualiser quand c’est possible, retirer quand c’est illégal, conserver les preuves quand c’est judiciaire. « La confiance n’est pas acquise d’emblée. Elle nécessite des preuves : des preuves de crédibilité, de responsabilité et de performance », résume Ysens de France, codirectrice du centre d’expertise en IA de la Gendarmerie nationale. Avec l’IA, la loi de Brandolini se vérifie plus que jamais : face à un faux qui devient presque gratuit et instantané à produire, ces preuves ont un coût en termes de temps et d’argent. Le prix de la confiance dans un monde où l’image, la voix et le texte ne prouvent plus rien par eux-mêmes.