SHA-256, heatmap, EXIF : le vocabulaire de la détection IA expliqué : Blog Certi-fy

Un avocat reçoit un rapport d'analyse d'image. Il lit : "score de probabilité IA 91%, heatmap GradCAM disponible, métadonnées EXIF absentes, SHA-256 : a3f7c2...". Son client lui demande si ce document peut être présenté au tribunal. L'avocat, pourtant aguerri aux preuves numériques, hésite. Non pas par manque de rigueur, mais parce que personne ne lui a jamais expliqué ce que ces termes signifient concrètement. Ce lexique est fait pour lui -- et pour tous ceux qui travaillent avec des images à l'ère de la génération artificielle.

SHA-256 : l'empreinte digitale d'un fichier

Le SHA-256 est une fonction de hachage cryptographique. En termes simples : c'est un algorithme qui transforme n'importe quel fichier -- une photo, un PDF, une vidéo -- en une chaîne de 64 caractères hexadécimaux, toujours de la même longueur, quel que soit le poids du fichier d'origine. Cette chaîne s'appelle le "hash" ou "empreinte" du fichier.

Ce qui rend le SHA-256 remarquable, c'est sa sensibilité absolue. Modifier un seul pixel dans une image de 12 mégapixels produit un hash totalement différent. Pas légèrement différent -- radicalement différent. Il n'existe aucune relation lisible entre deux hashs, même si les fichiers correspondants ne diffèrent que d'un seul octet. Cette propriété s'appelle l'effet avalanche.

Dans le contexte de la détection IA, le SHA-256 garantit l'intégrité du fichier : si le hash calculé au moment de l'analyse correspond au hash calculé plus tard, le fichier n'a pas été modifié entre les deux moments. C'est une preuve de non-altération.

Ce que le SHA-256 ne garantit pas, en revanche, c'est l'authenticité de l'auteur. Il prouve qu'un fichier est intact, pas qu'il a été créé par une personne humaine ou à tel moment précis. Pour cela, il faut combiner le hash à un horodatage certifié -- on y revient plus bas.

Métadonnées EXIF : la carte d'identité cachée d'une photo

EXIF signifie Exchangeable Image File Format. Ce standard est né dans les années 1990 avec l'émergence des appareils photo numériques grand public. Le principe : chaque photo prise par un appareil physique embarque, en plus des pixels visibles, un bloc de données invisibles à l'oeil nu mais lisibles par tout logiciel d'analyse.

Ces métadonnées peuvent contenir : le modèle de l'appareil photo ou du smartphone, la focale utilisée, la valeur ISO, la vitesse d'obturation, l'ouverture du diaphragme, la date et l'heure de la prise de vue (à la seconde près), et, si l'option GPS était activée, les coordonnées géographiques exactes de la capture.

Une image générée par intelligence artificielle, elle, naît sans appareil physique. Elle est produite par calcul, pas par capteur optique. Elle ne possède donc, par défaut, aucune métadonnée EXIF légitime. Certains outils de post-traitement peuvent injecter des EXIF factices -- un modèle d'appareil inventé, une date arbitraire -- mais ces ajouts laissent des incohérences détectables : des champs vides qui devraient être remplis, des valeurs impossibles pour l'optique déclarée, ou des données EXIF manifestement génériques.

L'absence d'EXIF n'est pas une preuve suffisante en elle-même -- certaines plateformes de réseaux sociaux ou outils de compression suppriment les métadonnées. Mais combinée à d'autres signaux, elle constitue un indicateur sérieux que la plateforme d'analyse d'images intègre dans son calcul de score global.

Score de probabilité IA : comprendre ce que le pourcentage exprime vraiment

C'est probablement le chiffre le plus mal interprété dans un rapport d'analyse. Quand un outil indique "probabilité IA : 87%", cela ne signifie pas que l'image "est une IA à 87%" ou qu'elle est "humaine à 13%". Cette lecture binaire est incorrecte.

Un score de probabilité IA est le résultat d'un modèle de classification entraîné sur des milliers d'images -- certaines générées par IA, d'autres capturées par des humains. Ce modèle a appris à reconnaître des patterns statistiques propres à chaque catégorie. Le score reflète le degré de convergence des signaux détectés dans une image avec les patterns caractéristiques des images générées.

Un score de 87% signifie que le modèle a identifié un faisceau de signaux très cohérent avec les patterns de génération artificielle, et que cette cohérence place l'image dans la zone haute de probabilité. Ce n'est pas une certitude mathématique, c'est une évaluation probabiliste basée sur l'ensemble des indicateurs disponibles.

Pour interpréter correctement ce chiffre, il faut toujours le lire en regard du détail des signaux qui le composent : le score EXIF, le score de texture, la heatmap, la présence ou absence de marquage invisible. Un score de 87% appuyé par six signaux concordants est plus robuste qu'un score identique reposant sur un seul indicateur dominant.

Heatmap et GradCAM : voir ce que le modele a vu

GradCAM est l'acronyme de Gradient-weighted Class Activation Mapping. Derrière ce nom technique se cache un outil d'interprétabilité des réseaux de neurones particulièrement précieux : la carte de chaleur, ou heatmap.

Lorsqu'un modèle analyse une image pour déterminer si elle est générée par IA, il ne "regarde" pas l'image de la même façon qu'un oeil humain. Il calcule des activations sur des couches profondes du réseau neuronal. GradCAM permet de rétro-propager ces activations vers l'espace visuel de l'image originale : les zones ayant le plus contribué à la décision du modèle apparaissent en rouge vif, les zones moins déterminantes en vert ou bleu.

Concrètement, une heatmap rouge concentrée sur les mains d'un personnage ou sur les lettres d'une enseigne en arrière-plan indique que le modèle a détecté dans ces zones des artefacts typiques de la génération artificielle -- les modèles IA ont historiquement du mal à produire des mains anatomiquement cohérentes ou du texte lisible.

La heatmap transforme une décision algorithmique opaque en raisonnement visuel. Elle permet à un expert humain -- ou à un juge -- de comprendre pourquoi le modèle a conclu ce qu'il a conclu, et d'évaluer si ce raisonnement est solide ou fragile. C'est un outil d'explicabilité, pas un outil de détection à proprement parler.

Diffusion latente : comprendre comment les images IA sont fabriquees

Pour comprendre pourquoi certains artefacts trahissent une image générée, il faut comprendre le mécanisme de fabrication. Les modèles dominants actuels -- Midjourney, Stable Diffusion, DALL-E, Firefly -- reposent tous sur un principe appelé diffusion latente.

Le processus se déroule en deux temps. D'abord, un encodeur compresse l'image dans un espace mathématique de faible dimension appelé espace latent. Ensuite, un réseau de neurones apprend à "débruiter" progressivement un signal aléatoire (du bruit pur) guidé par un prompt textuel, jusqu'à reconstruire une image cohérente dans cet espace latent, puis à la décoder vers l'espace pixel visible.

Ce processus de débruitage itératif laisse des traces. Les textures générées par diffusion latente présentent des régularités statistiques absentes dans les photographies naturelles : une cohérence trop parfaite dans les zones homogènes, des transitions de fréquences spatiales caractéristiques, des artefacts dans les zones à fort contraste. Ces signatures sont imperceptibles à l'oeil humain mais détectables par des modèles entraînés spécifiquement à les reconnaître.

C'est pourquoi les outils d'analyse d'images performants ne se contentent pas de chercher des erreurs visuelles grossières. Ils analysent les propriétés spectrales et statistiques de l'image à un niveau que l'oeil ne peut pas atteindre.

Horodatage et tiers de confiance : la date qui ne peut pas etre falsifiee

Les métadonnées EXIF contiennent une date de prise de vue. Le problème : cette date est stockée en clair dans le fichier et peut être modifiée avec n'importe quel logiciel d'édition d'image. Elle n'a aucune valeur probatoire en l'état.

Un horodatage certifié par un tiers de confiance, en revanche, est cryptographiquement lié à un instant précis. Le standard technique de référence s'appelle RFC 3161. Son fonctionnement : le hash du fichier est transmis à une autorité d'horodatage (TSA, Time Stamping Authority), qui y appose sa propre signature cryptographique incluant l'heure officielle de réception. Ce token d'horodatage est ensuite stocké séparément ou joint au fichier.

L'intérêt légal est majeur : même si le fichier original était ultérieurement modifié, le token d'horodatage resterait valide pour prouver que tel hash existait à telle date. Aucune modification rétroactive n'est possible sans invalider la signature de la TSA.

Dans un contexte juridique, la combinaison SHA-256 + horodatage RFC 3161 constitue une preuve d'antériorité techniquement solide, reconnue dans les systèmes judiciaires européens au titre du règlement eIDAS.

Watermark invisible : la signature que l'oeil ne voit pas

Certains générateurs d'images IA intègrent, au moment de la création, un marquage invisible dans les données de l'image. Ce watermark numérique, ou filigrane invisible, n'affecte pas l'apparence visuelle -- aucun observateur humain ne peut le voir -- mais il est détectable algorithmiquement par des outils spécialisés.

La technique la plus répandue s'appelle le watermarking spectral : des modifications infimes sont apportées aux composantes de fréquence de l'image (dans le domaine de la transformée de Fourier ou en cosinus discrète) selon un schéma connu de l'émetteur. Ce schéma est suffisamment robuste pour survivre à une compression JPEG modérée, un redimensionnement ou une légère modification de saturation.

L'AI Act européen, entré progressivement en application depuis 2024, encourage fortement cette pratique et exige que les contenus générés par IA soient signalés comme tels. Les grandes plateformes comme Google (via SynthID) ou Adobe (via Content Credentials) ont déjà déployé leurs propres implémentations. Cependant, l'uniformisation n'est pas encore acquise : tous les générateurs ne watermarquent pas leurs sorties, et les techniques de suppression de watermarks existent.

La détection de watermark invisible est donc un signal complémentaire, pas un critère exclusif. Sa présence confirme une origine IA ; son absence ne prouve rien dans un sens ou dans l'autre.

Lire un rapport d'analyse comme un professionnel

Ces sept notions forment l'ossature technique de tout rapport d'analyse d'image sérieux. Leur valeur n'est pas dans leur complexité, mais dans leur complémentarité. Un score de probabilité IA élevé devient plus convaincant quand la heatmap montre des zones d'activation cohérentes, quand les EXIF sont absentes, et quand un horodatage certifié ancre le fichier dans le temps. C'est le faisceau d'indices convergents qui constitue la preuve, pas un seul chiffre isolé.

Comprendre ce vocabulaire, c'est être en mesure d'évaluer la qualité d'un rapport, de poser les bonnes questions à un expert, et de présenter une analyse avec la précision qu'exigent les contextes professionnels et juridiques.

Analysez votre image et obtenez un rapport complet

SHA-256, EXIF, heatmap GradCAM, score de probabilité : chaque analyse Certi-fy détaille l'ensemble de ces signaux dans un rapport clair, exportable et certifiable.

Lancer une analyse gratuite