Brief IA : Ancestry : l'IA révolutionne la numérisation des archives familiales

Ancestry : l'IA révolutionne la numérisation des archives familiales

Brief IA
Tom Levy·4 min·1 vues

Ancestry utilise l'IA pour numériser 71 milliards d'archives familiales dans 88 pays, avec des modèles d'apprentissage automatique développés depuis 2014 pour améliorer la transcription et la reconnaissance faciale. En 2025, plus de 50 % des archives d'Ancestry seront générées par l'IA, triplant ainsi le taux de croissance du contenu. Cette initiative transforme la recherche généalogique mondiale en facilitant l'accès à des informations précieuses.

En bref
1Ancestry utilise l'IA pour accélérer la numérisation de 71 milliards d'archives familiales dans 88 pays.
2Depuis 2014, l'entreprise développe des modèles d'apprentissage automatique pour améliorer la transcription et la reconnaissance faciale.
3En 2025, plus de 50 % des archives d'Ancestry seront générées par l'IA, triplant ainsi le taux de croissance du contenu.
💡Pourquoi c'est importantL'IA permet à Ancestry de gérer efficacement un volume massif de données, transformant la recherche généalogique mondiale.
Le brief IA que lisent les pros

Le brief IA que les pros lisent chaque soir

Les 7 actus IA du jour, décryptées en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Ancestry et l'IA : une alliance pour la numérisation des archives

Depuis 2014, Ancestry a intégré des modèles de langage dans ses processus pour accélérer la numérisation des archives familiales à travers 88 pays. Cette initiative, dirigée par le directeur technique Sriram Thiagarajan, inclut des avancées en reconnaissance faciale et en transcription de notes manuscrites. Ces technologies permettent de traiter plus efficacement les documents historiques, facilitant ainsi l'accès à des informations précieuses pour les utilisateurs.

Un héritage de 42 ans de collecte de données

Au fil des 42 dernières années, Ancestry a amassé plus de 71 milliards de documents, allant des certificats de naissance aux licences de mariage, provenant de 88 pays. Ces documents ont permis la création de 148 millions d'arbres généalogiques. Historiquement, la collecte et l'organisation de ces données étaient des tâches chronophages, nécessitant une saisie manuelle par les employés et des fournisseurs tiers. L'expansion de l'entreprise à l'international, initiée en 2001 avec le lancement d'un site web au Royaume-Uni, a entraîné des coûts importants. Selon Sriram Thiagarajan, le temps requis pour numériser ces documents riches en contenu était un obstacle majeur.

L'impact de l'IA sous la direction de Thiagarajan

Depuis son arrivée en tant que directeur de l'information en 2017, Thiagarajan a joué un rôle clé dans l'intégration de l'apprentissage automatique et de l'intelligence artificielle chez Ancestry. L'acquisition de l'entreprise par Blackstone pour 4,7 milliards de dollars a marqué un tournant, permettant d'accélérer la numérisation grâce à l'IA. Cette technologie a également permis le développement de nouveaux outils pour les utilisateurs, notamment des systèmes de reconnaissance faciale et d'écriture manuscrite. Ces innovations ont transformé la manière dont les utilisateurs interagissent avec les archives familiales, rendant le processus plus rapide et plus précis.

L'évolution des modèles d'IA

En 2003, Jackson Reese a rejoint Ancestry pour diriger l'imagerie numérique. À l'époque, l'entreprise disposait d'un département d'imagerie réduit, chargé de numériser divers documents historiques. Reese a rapidement élargi son équipe à plus de 70 personnes, utilisant des technologies comme les scanners de microfilm. En 2014, Ancestry a commencé à développer ses propres modèles d'apprentissage automatique et de vision par ordinateur pour lire les documents papier. Cette initiative a évolué jusqu'en 2016, permettant à l'entreprise de créer des algorithmes capables de traiter efficacement des documents complexes.

L'intégration de BERT et l'amélioration des modèles

Avec l'introduction de BERT par Google en 2018, Ancestry a pu construire des outils d'extraction de données plus précis. Les experts examinaient les documents avant de les transmettre aux indexeurs pour transcription. Les modèles d'IA d'Ancestry, formés sur ces données, visaient une précision de plus de 90 %. Cependant, plusieurs itérations étaient parfois nécessaires pour affiner les modèles. Ce processus d'amélioration continue a permis à Ancestry d'optimiser ses systèmes pour mieux répondre aux besoins des utilisateurs.

L'impact de ChatGPT et des nouveaux modèles de langage

L'arrivée de ChatGPT en 2022 a marqué un tournant, ouvrant de nouvelles possibilités pour Ancestry. Les modèles de langage de grande taille d'OpenAI et d'autres ont permis d'accélérer la numérisation des données non structurées. Ancestry utilise désormais un mélange de modèles propriétaires et open-source pour traiter près de 200 langues avec peu d'entraînement itératif. Cette capacité multilingue est essentielle pour une entreprise opérant à l'échelle mondiale, car elle permet de gérer des archives provenant de divers contextes culturels et linguistiques.

Des fonctionnalités IA pour les utilisateurs

En septembre 2023, Ancestry a intégré des modèles de langage de grande taille pour des fonctionnalités destinées aux utilisateurs. Face Match, un outil de reconnaissance faciale, aide à identifier des personnes sur des photos de famille. Cette fonctionnalité innovante offre aux utilisateurs un moyen puissant de reconnecter avec leur passé familial, en identifiant des ancêtres à partir de photos anciennes.

Un avenir dominé par l'IA

D'ici la fin de 2025, plus de 50 % des archives historiques d'Ancestry seront générées par l'IA. Cette technologie a permis de tripler le taux de croissance du contenu, passant de 800 millions d'archives en 2021, à 5,2 milliards de nouvelles archives en 2022, et 18,6 milliards l'année suivante. Ancestry continue d'innover avec des cas d'utilisation externes de l'IA, comme l'ajout de la traduction de langues à son outil de transcription en 2026. Ces avancées témoignent de l'engagement d'Ancestry à utiliser l'IA pour enrichir l'expérience utilisateur et faciliter l'accès à l'histoire familiale.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires