Brief IA

Mastercard keeps tabs on fraud with new foundation model

🔬 Researchvia AI News·AI News·

Mastercard keeps tabs on fraud with new foundation model

Mastercard keeps tabs on fraud with new foundation model
En bref
1Mastercard a développé un modèle tabulaire large pour traiter les problèmes de sécurité dans les paiements numériques.
2Le modèle a été entraîné sur des milliards de transactions par carte.
3L'objectif est d'étendre son utilisation à des centaines de millions de transactions.
💡Pourquoi c'est importantce modèle pourrait transformer la manière dont les entreprises gèrent la fraude dans les paiements numériques.
📄
Article traduit en français

Mastercard surveille la fraude avec un nouveau modèle fondamental

Comment cela fonctionne

Mastercard a développé un grand modèle tabulaire (un LTM, par opposition à un LLM) qui est entraîné sur des données de transaction plutôt que sur du texte ou des images, afin de résoudre des problèmes de sécurité et d'authenticité dans les paiements numériques. La société a formé un modèle fondamental sur des milliards de transactions par carte, avec l'intention d'étendre ce nombre à des centaines de milliards au fil du temps.

Les ensembles de données comprennent des événements de paiement et des données associées telles que :

  • L'emplacement des commerçants
  • Les flux d'autorisation
  • Les incidents de fraude
  • Les rétrofacturations
  • L'activité de fidélité

Mastercard affirme que les identifiants personnels sont supprimés avant le début de l'entraînement et que le modèle analyse les schémas comportementaux plutôt que de se préoccuper des identités individuelles. En excluant les données personnelles, la technologie réduit les risques de confidentialité qui peuvent affecter d'autres formes d'IA dans le secteur des services financiers. L'échelle et la richesse des données permettent au modèle d'inférer des schémas qui sont commercialement précieux, malgré l'absence d'informations par utilisateur. Bien que l'anonymisation supprime des signaux qui pourraient être jugés utiles dans le domaine de l'évaluation des risques, Mastercard soutient que l'utilisation de volumes suffisamment importants de données comportementales compense toute perte de données riches.

Qu'est-ce qu'un LTM (modèle tabulaire large) ?

L'architecture LTM diffère de celle des grands modèles de langage, qui sont entraînés sur des entrées non structurées et fonctionnent en prédisant le prochain jeton (généralement mais de manière inexacte décrit comme un mot) dans une séquence. Le LTM de Mastercard examine les relations entre les champs dans des tables de données multidimensionnelles, ce qui rend la définition de la technologie plus proche de celle de l'apprentissage automatique pur que de l'intelligence artificielle.

Le grand modèle tabulaire apprend à partir d'entrées brutes exactement quelles relations sont prévisibles, lui permettant d'identifier des schémas anormaux non capturés par des règles prédéfinies. La société décrit le LTM comme un moteur d'insights qui peut être utilisé dans des produits existants, augmentant les flux de travail actuels. Le risque opérationnel d'un modèle qui interagit avec les clients (souvent un LLM) diffère de celui qui fait partie de la prise de décision interne. L'infrastructure technique pour le LTM provient de Nvidia et Databricks, le premier fournissant la plateforme de calcul et Databricks s'occupant de l'ingénierie des données et du développement du modèle.

Où verrons-nous un LTM en opération ?

La cybersécurité chez Mastercard est le premier domaine à voir le déploiement actif de cette technologie. Comme de nombreuses institutions, Mastercard exploite plusieurs systèmes de détection de fraude examinant les données de transaction. Ceux-ci nécessitent une intervention humaine à leur début – et une atténuation continue – pour définir ce qui constitue un comportement suspect.

Ces comportements peuvent inclure :

  • Des augmentations soudaines de la fréquence des transactions
  • Des utilisateurs effectuant des achats dans différentes parties du monde en peu de temps

Les premiers résultats indiquent une amélioration des performances par rapport aux techniques conventionnelles dans des cas spécifiques, selon la société. Elle cite l'exemple d'achats de haute valeur et de faible fréquence qui peuvent être signalés comme des anomalies à l'aide de modèles traditionnels, mais le nouveau modèle semble capable de distinguer les événements légitimes plus précisément que ses homologues.

La société prévoit de déployer des systèmes hybrides qui combinent des procédures établies avec le nouveau modèle, une prudence qui reflète les niveaux réglementaires sous lesquels elle opère. Elle reconnaît qu'aucun modèle unique n'est susceptible de bien performer dans tous les scénarios, donc le LTM prendra sa place parmi les outils dans ce domaine.

Il est affirmé que le modèle peut analyser l'activité sur les programmes de fidélité, être utilisé dans la gestion de portefeuille, et pour des analyses internes, des domaines où il existe de grands volumes de données structurées. Dans les opérations actuelles, les entreprises déploient souvent de nombreux modèles adaptés à chaque tâche, mais cela peut impliquer des coûts de formation multiples ainsi que des efforts de validation et de surveillance. Un seul modèle fondamental qui peut être ajusté pour différentes tâches pourrait simplifier les processus et réduire les coûts.

Risques et projets futurs

Il existe un risque associé à l'approche multi-fonction du LTM : un échec dans un modèle largement déployé pourrait avoir des conséquences à l'échelle du système, ce qui explique en partie la stratégie de Mastercard d'appliquer sa technologie aux systèmes de détection existants – du moins pour le moment.

Mastercard espère augmenter l'échelle des données utilisées sur le modèle et sa sophistication globale. Elle prévoit également un accès API et des SDK pour permettre aux équipes internes de créer de nouvelles applications. Le billet de blog souligne les responsabilités en matière de données que le LTM détient, mentionnant la confidentialité et la transparence, l'explicabilité du modèle, et l'auditabilité.

Un examen réglementaire de tout système influençant les décisions de crédit ou les résultats de fraude est à prévoir, en plus de toute pratique de données impliquée dans l'opération du LTM. Des données hautement structurées, par opposition à du texte ou des images, sont au cœur du LTM. Les grands modèles tabulaires pourraient être le début d'une nouvelle génération de systèmes d'IA dans l'infrastructure bancaire et de paiements.

Les preuves à ce jour restent limitées aux rapports des fournisseurs, donc toute affirmation de performance ne devrait pas nécessairement être considérée comme concluante. La robustesse dans des conditions adversariales, les coûts à long terme après l'entraînement, et l'acceptation réglementaire sont tous des enjeux sur lesquels les modèles tabulaires pourraient échouer ou prospérer. Ces facteurs détermineront le rythme et l'étendue de l'adoption, mais c'est dans ce domaine que Mastercard place actuellement certains de ses paris.

TwitterLinkedIn

Brief IA — Veille IA quotidienne

Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.