Tu codes avec l’IA ?
Outils, agents et nouveautés dev IA décryptés, chaque soir en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Netflix a récemment mis à disposition du public un cadre d'intelligence artificielle nommé VOID (Video Object and Interaction Deletion). Ce système se distingue par sa capacité à supprimer des objets de vidéos tout en ajustant automatiquement les effets physiques que ces objets exerçaient sur la scène environnante. En d'autres termes, VOID ne se contente pas d'effacer un objet, il modifie également les interactions physiques, comme les collisions, que cet objet avait initialement provoquées.
Le développement de VOID repose sur le modèle de diffusion vidéo CogVideoX d'Alibaba. Ce modèle a été affiné grâce à des données synthétiques issues de Kubric de Google et de HUMOTO d'Adobe, qui sont utilisées pour la détection des interactions. Gemini 3 Pro de Google joue un rôle crucial en analysant la scène pour identifier les zones affectées, tandis que SAM2 de Meta est chargé de la segmentation des objets à retirer. Pour parfaire le résultat, un second passage optionnel utilise le flux optique afin de corriger d'éventuelles distorsions de forme.
Ce projet a été mené par des chercheurs de Netflix en collaboration avec l'INSAIT Sofia University. Les ressources liées à VOID, incluant le code source, un article détaillé et une démonstration, sont disponibles sur des plateformes telles que GitHub, arXiv et Hugging Face. Le système est distribué sous la licence Apache 2.0, autorisant ainsi son utilisation à des fins commerciales.



