Révélation choquante : l’IA découvre que chaque empreinte digitale n’est pas unique

Patrick Lesggie

Par l’École d’ingénierie et de sciences appliquées de l’Université Columbia, 27 janvier 2024

Une équipe d’étudiants de premier cycle de l’École d’ingénierie de Columbia a utilisé l’IA pour remettre en question l’hypothèse judiciaire selon laquelle les empreintes digitales de différents doigts de la même personne sont incompatibles, découvrant un nouveau type de marqueur judiciaire. Malgré des sceptiques initiaux, leurs découvertes, qui pourraient révolutionner la science judiciaire, ont été publiées dans Science Advances.

Les ingénieurs de Columbia ont développé une nouvelle IA qui remet en question une croyance de longue date en matière de sciences judiciaires : les empreintes digitales de différents doigts de la même personne sont uniques. Il s’avère qu’elles sont similaires, mais nous avons comparé les empreintes digitales de la mauvaise manière !

De « New York, unité spéciale » à « Les Experts », sans oublier la vie réelle, les enquêteurs ont utilisé les empreintes digitales comme critère de référence pour relier les criminels à un crime. Mais si un coupable laisse des empreintes de différents doigts dans deux scènes de crime différentes, il est très difficile de relier ces scènes, et la trace peut se perdre.

Il est bien accepté dans la communauté de la science judiciaire que les empreintes digitales de différents doigts de la même personne – les « empreintes digitales intra-personnelles » – sont uniques et donc incompatibles.

Recherche menée par une équipe de premier cycle de l’École d’ingénierie de Columbia

Une équipe dirigée par l’étudiant de premier cycle de l’École d’ingénierie de Columbia, Gabe Guo, a remis en question cette présomption largement admise. Guo, qui n’avait aucune connaissance préalable en matière de sciences judiciaires, a trouvé une base de données publique du gouvernement américain comprenant environ 60 000 empreintes digitales et les a introduites par paires dans un système basé sur l’intelligence artificielle connu sous le nom de réseau de contraste profond. Parfois, les paires appartenaient à la même personne (mais à des doigts différents), et parfois à des personnes différentes.

Saliency Map Fingerprint

La carte de saillance met en évidence les zones qui contribuent à la similarité entre les deux empreintes digitales de la même personne. Crédit : Gabe Guo,/Columbia Engineering

AI a le potentiel d’améliorer considérablement la précision judiciaire

Au fil du temps, le système d’IA, que l’équipe a conçu en modifiant une infrastructure de pointe, est devenu meilleur pour déterminer quand des empreintes digitales en apparence uniques appartenaient à la même personne et quand elles ne le faisaient pas. La précision pour une seule paire est de 77 %. Lorsque plusieurs paires ont été présentées, la précision a considérablement augmenté, ce qui pourrait augmenter l’efficacité judiciaire actuelle de plus de dix fois. Le projet, une collaboration entre le laboratoire de machines créatives de Hod Lipson à l’École d’ingénierie de Columbia et le laboratoire de capteurs intégrés et d’informatique de l’Université de Buffalo, SUNY, dirigé par Wenyao Xu, a été publié aujourd’hui dans Science Advances.

Résultats de l’étude qui remettent en question – et surprennent – la communauté judiciaire

Une fois l’équipe a confirmé leurs résultats, ils ont rapidement envoyé les découvertes à une revue judiciaire bien établie, pour recevoir un refus quelques mois plus tard. L’expert relecteur anonyme et l’éditeur ont conclu que « Il est bien connu que chaque empreinte digitale est unique », et qu’il ne serait donc pas possible de détecter des similitudes même si les empreintes digitales provenaient de la même personne.

L’équipe n’a pas abandonné. Ils ont redoublé d’efforts, ont alimenté leur système d’IA avec encore plus de données, et le système a continué à s’améliorer. Consciente du scepticisme de la communauté judiciaire, l’équipe a choisi de soumettre leur manuscrit à un public plus général. L’article a été à nouveau rejeté, mais Lipson, qui est le professeur James et Sally Scapa d’innovation au département de génie mécanique et co-directeur de l’installation Makerspace, a fait appel. « Je ne conteste normalement pas les décisions éditoriales, mais cette découverte était trop importante pour être ignorée », a-t-il déclaré. « Si cette information fait pencher la balance, alors je pense que des affaires non résolues pourraient être relancées, et même que des personnes innocentes pourraient être acquittées. »

Alors que la précision du système n’est pas suffisante pour trancher officiellement une affaire, elle peut aider à prioriser les pistes dans des situations ambiguës. Après de nombreux échanges, l’article a finalement été accepté pour publication dans Science Advances.

Dévoilé : un nouveau type de marqueur judiciaire pour capturer précisément les empreintes digitales

Le point de friction vient de la question suivante : Quelles informations alternatives l’IA utilisait-elle réellement qui ont échappé à des décennies d’analyses judiciaires ? Après de minutieuses visualisations du processus décisionnel du système d’IA, l’équipe a conclu que l’IA utilisait un nouveau type de marqueur judiciaire.

« L’IA n’utilisait pas de « minuties », qui sont les embranchements et les terminaisons dans les crêtes des empreintes digitales – les motifs utilisés dans la comparaison traditionnelle des empreintes digitales », a déclaré Guo, qui a commencé l’étude en première année à l’École d’ingénierie de Columbia en 2021. « Au lieu de cela, elle utilisait quelque chose d’autre, lié aux angles et aux courbures des tourbillons et boucles au centre de l’empreinte digitale. »

Aniv Ray, étudiant de dernière année en génie à Columbia, et Judah Goldfeder, étudiant au doctorat, ont noté que leurs résultats ne sont que le début. « Imaginez la performance de cet outil une fois qu’il aura été entraîné sur des millions, au lieu de milliers d’empreintes digitales », a déclaré Ray.

Un besoin de jeux de données plus larges

L’équipe est consciente des biais potentiels dans les données. Les auteurs présentent des preuves indiquant que l’IA se comporte de manière similaire en fonction du genre et de la race, lorsque des échantillons sont disponibles. Cependant, ils notent que des validations plus approfondies doivent être effectuées en utilisant des ensembles de données plus larges si cette technique doit être utilisée en pratique.

Le potentiel transformateur de l’IA dans un domaine bien établi

Cette découverte est un exemple de choses plus surprenantes à venir de l’IA, note Lipson. « Beaucoup de gens pensent que l’IA ne peut pas vraiment faire de nouvelles découvertes – qu’elle se contente de régurgiter des connaissances », a-t-il déclaré. « Mais cette recherche est un exemple du fait qu’une IA même assez simple, alimentée par un ensemble de données relativement basique que la communauté de la recherche avait à sa disposition depuis des années, peut fournir des idées qui ont échappé à des experts depuis des décennies. »

Il ajoute : « Ce qui est encore plus excitant, c’est le fait qu’un étudiant de premier cycle, sans expérience en matière de sciences judiciaires, peut utiliser l’IA pour remettre en question avec succès une croyance largement répandue dans tout un domaine. Nous sommes sur le point de connaître une explosion de découvertes scientifiques dirigées par l’IA par des non-experts, et la communauté d’experts, y compris le milieu universitaire, doit se préparer. »

Référence : « Unveiling intra-person fingerprint similarity via deep contrastive learning » par Gabe Guo, Aniv Ray, Miles Izydorczak, Judah Goldfeder, Hod Lipson et Wenyao Xu, 12 janvier 2024, Science Advances. DOI : 10.1126/sciadv.adi0329