Un réseau neuronal redéfinit la détection de fraude

⚡

Key Takeaways

1Un réseau neuronal a appris des règles de fraude interprétables à partir de données sans intervention humaine.

2Le modèle a atteint un ROC-AUC de 0.933, redécouvrant des caractéristiques clés comme V14.

3L'architecture hybride combine apprentissage statistique et logique lisible, crucial pour la conformité.

💡Why it matters — Cette avancée permet aux systèmes d'IA de générer des règles explicables, essentielles pour des secteurs réglementés comme la finance.

L'innovation dans le domaine de l'intelligence artificielle ne cesse de repousser les limites de ce que nous pensions possible. Une récente expérience a démontré qu'un réseau neuronal peut apprendre à générer ses propres règles de détection de fraude, sans intervention humaine directe. Cette approche utilise l'induction de règles différentiable pour extraire des règles de type SI-ALORS à partir d'un réseau neuronal déjà entraîné. L'objectif est de créer des règles de fraude audibles et interprétables sans avoir à les coder manuellement.

Dans cette expérience, un réseau neuronal hybride a été enrichi d'un module d'apprentissage de règles différentiable. Ce module a la capacité d'extraire automatiquement des règles de fraude pendant le processus d'entraînement. En utilisant le jeu de données de fraude par carte de crédit de Kaggle, qui présente un taux de fraude de 0,17%, le modèle a réussi à apprendre des règles interprétables. Par exemple, une règle typique pourrait être : SI V14 < −1.5σ ET V4 > +0.5σ → Fraude, où σ représente l'écart-type de la caractéristique après normalisation.

Le module d'apprentissage de règles a atteint un score ROC-AUC de 0.933 ± 0.029, tout en maintenant une fidélité de 99,3% aux prédictions du réseau neuronal. Ce qui est particulièrement remarquable, c'est que le modèle a redécouvert de manière indépendante la caractéristique V14, une variable depuis longtemps reconnue par les analystes comme fortement corrélée à la fraude, sans qu'on lui ait explicitement indiqué de la rechercher.

Ce que le Modèle a Découvert

Avant de plonger dans les détails techniques de l'architecture ou de la fonction de perte, il est essentiel de comprendre les découvertes finales du modèle. Après un entraînement allant jusqu'à 80 époques, avec un arrêt précoce, la plupart des graines ont convergé entre les époques 56-78. Le module d'apprentissage de règles a produit des résultats significatifs dans deux graines spécifiques où les règles étaient clairement définies.

Dans le cas de la Graine 42, la règle la plus claire comportait cinq conditions avec une confiance de 0.95. La règle apprise était : SI V14 < −1.5σ. Pour la Graine 7, une règle complémentaire avec huit conditions et une confiance de 0.74 a été identifiée : SI V14 < −1.6σ. Dans les deux scénarios, les faibles valeurs de V14 étaient centrales dans la logique de détection de fraude, illustrant une convergence frappante en l'absence de directives préalables.

Le modèle n'a jamais reçu d'informations spécifiques sur l'importance des caractéristiques. Pourtant, il a indépendamment redécouvert la même caractéristique que les analystes humains avaient identifiée depuis des années. Cette capacité d'un réseau neuronal à découvrir ses propres règles de fraude incarne la promesse de l'IA neuro-symbolique : combiner l'apprentissage statistique avec une logique lisible par l'homme. Le reste de cet article explore comment cette découverte a été possible et pourquoi le gradient a continué à identifier V14 même sans informations préalables.

Des Règles Injectées aux Règles Apprises — Pourquoi Cela a de l'Importance

Chaque modèle de détection de fraude possède une frontière de décision. Cependant, les équipes de fraude travaillent avec des règles. L'écart entre ce que le modèle apprend et ce que les analystes peuvent comprendre, auditer et défendre devant un régulateur est crucial pour la conformité.

Dans un article précédent de cette série, deux règles d'analystes ont été encodées directement dans la fonction de perte : si le montant de la transaction est anormalement élevé et si la signature PCA est anormale, l'échantillon est traité comme suspect. Cette approche a fonctionné, permettant au modèle hybride d'égaler la performance de détection d'un réseau neuronal pur tout en restant interprétable.

Cependant, une limitation évidente subsistait : ces règles étaient écrites à la main. Elles étaient basées sur des caractéristiques choisies pour leur sens intuitif. Les règles codées à la main sont efficaces lorsque les motifs de fraude sont stables et que la connaissance du domaine est profonde. Mais elles sont inadéquates lorsque les motifs évoluent, que les caractéristiques sont anonymisées (comme dans ce jeu de données), ou lorsque l'on souhaite que le modèle mette en évidence des signaux inattendus.

La question naturelle qui se pose est : quelles caractéristiques le gradient choisirait-il s'il avait la liberté de choisir ? Ce schéma s'étend au-delà de la fraude. Les systèmes de diagnostic médical nécessitent des règles vérifiables par les médecins avant de prendre des décisions. Les modèles de cybersécurité ont besoin de règles auditables par les ingénieurs. Les systèmes de lutte contre le blanchiment d'argent opèrent sous des cadres réglementaires exigeant des décisions explicables. Dans tout domaine combinant des événements rares, une expertise de domaine et des exigences de conformité, la capacité d'extraire des règles audibles de type SI-ALORS d'un réseau neuronal entraîné est directement précieuse.

Architecturalement, le changement est étonnamment simple. Il ne s'agit pas de remplacer le MLP, mais d'ajouter un second chemin qui apprend à exprimer les décisions du MLP sous forme de règles symboliques lisibles par l'homme. Le MLP s'entraîne normalement, tandis que le module de règles apprend à être en accord avec lui, sous forme symbolique. C'est le sujet de cet article : l'induction de règles différentiable en environ 250 lignes de PyTorch, sans connaissance préalable des caractéristiques importantes.

“Vous ne remplacez pas le réseau neuronal. Vous lui apprenez à s'expliquer.”

L'Architecture : Trois Éléments Apprenables

L'architecture conserve un réseau neuronal standard intact, mais ajoute un second chemin qui apprend des règles symboliques expliquant les décisions du réseau. Les deux chemins fonctionnent en parallèle à partir de la même entrée et leurs sorties sont combinées par un poids apprenable α :

Le Hybrid Rule Learner fonctionne avec deux chemins en parallèle à partir de la même entrée de 30 caractéristiques. Le chemin MLP gère la détection ; le chemin de règles apprend à l'expliquer. α est un scalaire entraînable — pas un hyperparamètre.

Le chemin MLP est identique à l'article précédent : trois couches entièrement connectées avec normalisation par lot. Le chemin de règles est nouveau. Alpha est un scalaire apprenable que le modèle utilise pour pondérer les deux chemins, il commence à 0.5 et est entraîné par descente de gradient comme tout autre paramètre. Après l'entraînement, α a convergé à environ 0.88 en moyenne à travers les graines (plage : 0.80–0.94). Le modèle a appris à pondérer le chemin neuronal à environ 88% et le chemin de règles à 12% en moyenne. Les règles ne remplacent pas le MLP, elles sont un résumé symbolique structuré de ce que le MLP a appris.

1. Discrétiseur Apprenable

Les règles nécessitent des entrées binaires — V14 est-il en dessous d'un seuil ? oui ou non. Les réseaux neuronaux ont besoin d'opérations continues et différentiables. Le seuil sigmoïde doux fait le lien entre les deux.

Pour chaque caractéristique f et chaque seuil apprenable t :

bf,t=σ ⁣(xf−θf,tτ)

xf est la valeur de la caractéristique f pour cette transaction
θf,t est un seuil apprenable, initialisé aléatoirement, entraîné par rétropropagation
τ est la température — élevée au début de l'entraînement (exploratoire), faible plus tard (précise)

bf,t est la sortie binaire douce : “la caractéristique f est-elle au-dessus du seuil t ?”

Le modèle apprend trois seuils par caractéristique, lui donnant trois “coupes” par dimension. Chaque seuil est indépendant — le modèle peut les répartir sur la plage de la caractéristique ou les concentrer autour du point de coupe le plus discriminatif.

2. Couche d'Apprentissage de Règles

Chaque règle est une combinaison pondérée de caractéristiques binarisées, passée par un sigmoïde :

ruler(x)=σ ⁣(∑iwr,i⋅biτ)

Le signe de chaque poids a une interprétation directe après écrasement par tanh :

w>+0.5 → la caractéristique doit être ÉLEVÉE pour que cette règle s'active
w<−0.5 → la caractéristique doit être FAIBLE pour que cette règle s'active
|w|<0.5 → la caractéristique est sans importance pour cette règle

L'extraction de règles suit directement : seuiler les valeurs absolues des poids après l'entraînement pour identifier quelles caractéristiques chaque règle utilise. C'est ainsi que les déclarations SI-ALORS émergent de paramètres continus — en lisant la matrice de poids.

3. Température d'Annealing

La température suit un calendrier de décroissance exponentielle :

τ(t)=τstart⋅(τendτstart)t/T

Avec τ_start=5.0, τ_end=0.1, T=80 époques :

Époque 0 : τ=5.00 — Règles entièrement douces — le gradient s'écoule partout
Époque 40 : τ=0.69 — Règles se resserrant — seuils s'engageant
Époque 79 : τ=0.10 — Règles presque nettes — lisibles comme SI-ALORS

La température τ décroît exponentiellement sur 80 époques, passant d'une douceur exploratoire (τ=5.0) à une netteté presque binaire (τ=0.1). La zone ombragée montre la région où les gradients sont encore informatifs.

Sans annealing, le modèle reste doux et les règles ne se cristallisent jamais en quelque chose qu'un analyste de fraude peut lire ou qu'une équipe de conformité peut approuver. L'annealing est ce qui convertit une optimisation continue en une sortie symbolique.