Tu suis la course aux modèles IA ?
Chaque sortie (GPT, Claude, Gemini, Mistral…) décryptée le soir même, en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Google Deepmind a récemment annoncé une avancée majeure en associant son modèle de monde Genie aux images de Street View. Cette innovation permet de créer des environnements interactifs générés par intelligence artificielle, basés sur des lieux réels. Grâce à la vaste base de données de Street View, les utilisateurs peuvent explorer des mondes virtuels ancrés dans la réalité.
Un terrain d'entraînement pour l'IA
La fonctionnalité est actuellement en phase de prototype expérimental et est accessible aux abonnés de Google AI Ultra. Elle est limitée aux emplacements situés aux États-Unis et présente encore des imperfections graphiques. Cependant, elle offre un terrain d'entraînement réaliste pour les agents IA, les robots et les voitures autonomes, grâce à l'intégration des données de Street View.
Les utilisateurs peuvent choisir un emplacement sur une carte, sélectionner un style visuel tel que "Monde Océan", "Sables du Désert", "Âge de Pierre" ou "Film N&B", et décrire un personnage. Le modèle Genie 3 génère alors un monde interactif à partir de séquences réelles de Street View. Cette technologie repose sur le "Maps Imagery Grounding", une interface déjà utilisée par les développeurs pour créer des visuels IA à partir des données de Street View.
Des démonstrations impressionnantes
Pour illustrer les capacités de cette technologie, Google a présenté des démonstrations telles qu'un Golden Gate Bridge inondé et les Fort Worth Stockyards au Texas stylisés comme dans les années 1920. Ces exemples montrent non seulement la portée de la technologie, mais aussi ses limites actuelles, avec des textures floues et des transitions parfois surréalistes.
L'agent SIMA 2 de Deepmind utilise déjà Genie comme terrain d'entraînement, tandis que Waymo s'en sert pour simuler des scénarios de rue réalistes pour les voitures autonomes. La connexion à Street View permet à ces sessions d'entraînement d'être ancrées à des emplacements réels spécifiques.
Démonstrations et accès
Les premières démonstrations ressemblent à un mélange de vitrine technologique et d'aperçu de jeu. Bilawal Sidhu, un ancien chef de produit chez Google pour la réalité augmentée/virtuelle et les cartes 3D, a publié une série de prompts de test montrant ce à quoi cela ressemble en pratique. Il a fait la course avec une voiture de Formule 1 aux couleurs de Google Maps sur le Las Vegas Strip, a roulé en tant qu'écureuil sur un scooter devant le Palais des Beaux-Arts, a piloté un bateau sur le Lady Bird Lake d'Austin, et a marché à travers la Maison Blanche en utilisant des données de Street View en intérieur.
Vers une expansion mondiale
Le projet Genie avec l'ancrage de Street View est en cours de déploiement mondial pour les abonnés de Google AI Ultra, un service premium facturé 200 dollars par mois. Bien que la fonctionnalité soit pour l'instant limitée aux États-Unis, Google prévoit une expansion future. Deepmind considère ce projet comme un prototype de recherche, et l'équipe travaille déjà sur une version améliorée.
En somme, cette innovation de Google Deepmind pourrait bien redéfinir la manière dont les agents IA et les robots sont entraînés, en leur offrant des environnements réalistes et ancrés dans des données réelles.