Contexte
Pendant que l'Est de la République Démocratique du Congo traverse une période de tension, l'actualité est marquée par l'organisation de pourparlers complexes entre le gouvernement de Kinshasa, le mouvement politico-militaire de l'AFC/M23 et le Rwanda. Dans ce climat de haute volatilité diplomatique et militaire, de nombreuses rumeurs et contenus manipulés envahissent les réseaux sociaux numériques.
C'est notamment le cas d'une vidéo virale sur TikTok, prétendant montrer le président Félix Tshisekedi qui promet de bombarder le Rwanda; une déclaration qui, après analyse, s'avère être un montage trompeur. En utilisant des outils de vérification numérique, dont Hive Moderation et Basic AI Voice Detection Analysis, et en passant au peigne fin les archives des médias d'information crédibles, nous avons compris qu’il s’agit plutôt d’une manipulation par intelligence artificielle.
Contenu Infox
Cette Vidéo de quelques secondes, mise en ligne le 14 mars dernier par le tiktokeur Ivan Barkisen, est constituée d’un tapis sonore attribué au Président de la République démocratique du Congo, auquel on associe des photos sur lesquelles sont visibles soit Félix Tshisekedi (RDC), soit Paul Kagame (Rwanda), soit Donald Trump (Etats-Unis). « Une décision importante. Vous savez, Paul Kagame nous a beaucoup massacrés. Aujourd’hui j’annonce le bombardement du Rwanda. J’ai décidé de le détruire, et personne ne peut pas m’arrêter. Même après la signature de l’accord de paix à Washington, la guerre continue et ce qui est là, c’est de supprimer le Rwanda et après le Rwanda, ça sera l’Ouganda », reprend la déclaration attribuée à Félix Tshisekedi.
Le commentaire qui l’accompagne mentionne (sans correction) : « L'affaire est sérieuse. Le président Félix Tshisekedi annonce le bombardement du Rwanda. Et Déclare la guerre au Rwanda, et affrontez-vous sur le champ de bataille. Et décider de destruire le Rwanda ».
En un mois déjà, le post cumule plus de 6 milles mentions «j’aime», près de 1500 partages et plus de 100 commentaires. Le doute gagne la plupart des tiktokeurs qui commentent cette publication. « ni capacité ni moyen», lâche (sans correction) ce premier. Cet autre s’interroge (sans correction) « ah bon , est ce vrai ça ?». Cet internaute mentionne quant à lui : « Nous sommes d’accord avec vous malgré que c’est l’IA qui parle».
Une génération IA
Pour commencer, nous sommes entrés en contact avec la porte-parole du Chef de l'État. Tina Salama a formellement démenti les allégations circulant sur les réseaux sociaux, qualifiant de « Fake News » la vidéo prétendant que le président Félix Tshisekedi a annoncé son intention de bombarder le Rwanda. Elle a précisé que ce contenu est une manipulation grossière visant à désinformer l'opinion publique dans un contexte sécuritaire déjà fragile.
Plus loin, pour analyser ce contenu vocal, nous avons d'abord recouru à l’outil de détection « Basic AI Voice Detection Analysis ». A 51 %, l'outil estime qu'il y a plus de chance que l'audio soit généré par une machine. C'est un score de suspicion modérée, mais qui n'est pas définitif. Malgré la faible confiance à ce résultat, l'outil classe l'audio comme probablement synthétique, créé par IA. Ceci est plutôt renforcé par le résultat de l’analyse segmentée qui attribue 94% AI à ce contenu. Cela signifie que si l'ensemble du fichier est jugé douteux avec une faible confiance, un passage précis (à 9 secondes sur 25) présente des caractéristiques techniques très fortes d'une voix synthétique.

Résultats obtenus de l’analyse par l’outil Basic AI Voice Detection Analysis, capture faite par Eleza Fact
Ce résultat n’ayant pas été suffisant dans le cadre de cette vérification, nous avons joint à cet outil Hive Moderation, un outil de détection de contenu généré par intelligence artificielle.Après analyse, l'outil affiche une alerte en rouge : « Cette entrée est susceptible de contenir du contenu généré par l'IA ou deepfake ». Cela signifie que le système a détecté des anomalies majeures qui ne correspondent pas à un enregistrement naturel et authentique.
En effet, l'analyse est décomposée en trois catégories spécifiques. La première porte sur le discours généré par l'IA, un score de 97,5 %. C'est le point le plus critique. Ce score aussi élevé indique qu'il est presque certain que la voix a été créée ou modifié par une IA du type "Text-to-Speech" ou clonage de voix. La deuxième catégorie présente à seulement 34,3 % la vidéo comme étant générée par l'IA. Ce score modéré suggère que si la structure globale de la vidéo semble réelle, certains éléments visuels pourraient avoir été retouchés ou générés. La troisième catégorie, c’est un score plus faible, 0,4 %, qui montre que ce contenu est un Deepfake. Cela indique que l'outil ne détecte pas de manipulation de type "remplacement de visage" particulièrement complexe, mais se concentre plutôt sur l'aspect synthétique de la voix et de l'image.
Résultats obtenus de l’analyse par l’outil Hive Moderation, capture faite par Eleza Fact
Au-delà de l’absence de preuves crédibles autour d’un quelconque discours du Président de la RDC annonçant bombarder le Rwanda, nous avons constaté des erreurs de français dans le discours attribué à Félix Tshisekedi. « J’ai décidé de le détruire, et personne ne peut pas me l’interdire » au lieu de « J’ai décidé de le détruire, et personne ne peut me l’interdire ». « Ce qui est là est de supprimer le Rwanda entière » au lieu de « Ce qui est là est de supprimer le Rwanda entier ». Mêmement, la gestion de la respiration dans ce discours n’est pas bien assurée lorsque la voix passe d’une phrase à une autre. Cela se confirme également avec des pauses stratégiques qui se remarquent dans ce discours.
En définitive,
Cette vidéo virale n'est rien d'autre qu'un trompe-l'œil numérique. En vrai, derrière cette menace de bombardement se cache une génération artificielle par clonage de voix, dont les scores de suspicion atteignent 97,5 %. Ce contenu n'est pas une déclaration officielle, mais un assemblage de photos décontextualisées, en témoigne le démenti de la porte-parole de Félix Tshisekedi. L'auteur de l'infox a simplement récupéré des images issues de différentes sorties médiatiques de Félix Tshisekedi, notamment lors de rencontres internationales avec Paul Kagame ou Donald Trump, pour donner une voix synthétique n’appartient pas au président de la RDC. Entre les fautes de syntaxe grossières et les irrégularités de respiration détectées dans l'audio, les preuves de la manipulation sont flagrantes.
Dans un climat sécuritaire aussi volatil à l'Est de la RDC, ce type de contenu ne cherche qu'à instrumentaliser l'émotion et à attiser le conflit. Méfiez-vous des apparences : la technologie permet aujourd'hui de faire dire n'importe quoi à n'importe qui. Restez vigilants et ne partagez que des informations confirmées par des médias de référence.
