Netflix rend public VOID, un cadre IA qui efface des objets vidéo et réécrit la physique laissée derrière
💻 Code & Dev

Netflix rend public VOID, un cadre IA qui efface des objets vidéo et réécrit la physique laissée derrière

The Decoder
Matthias Bastian·1 min·4 vues
En bref
1Netflix a développé un cadre d'intelligence artificielle capable de retirer des objets des vidéos tout en ajustant automatiquement les effets physiques.
2Le projet VOID est désormais open-source, permettant à d'autres développeurs d'y accéder et de l'utiliser.
3Cette innovation pourrait transformer la production vidéo en simplifiant les effets spéciaux et en réduisant les coûts.
💡Pourquoi c'est importantcette technologie pourrait révolutionner la manière dont les contenus vidéo sont créés et modifiés, offrant de nouvelles opportunités dans l'industrie du divertissement.
📄
Article traduit en français

Netflix rend public VOID, un cadre IA qui efface des objets vidéo et réécrit la physique laissée derrière

Netflix a rendu public un cadre d'IA capable de retirer des objets de vidéos et d'ajuster automatiquement les effets physiques que ces objets avaient sur le reste de la scène. Ce système s'appelle VOID, acronyme de "Video Object and Interaction Deletion". Ce qui le rend spécial, c'est qu'en plus d'effacer des objets d'une scène, il gère également les effets physiques en aval, comme les collisions, que l'objet retiré avait initialement causés.

VOID est construit sur le modèle de diffusion vidéo CogVideoX d'Alibaba, affiné avec des données synthétiques provenant de Kubric de Google et de HUMOTO d'Adobe pour la détection d'interactions. Gemini 3 Pro de Google analyse la scène et identifie les zones affectées, tandis que SAM2 de Meta s'occupe de la segmentation des objets à retirer. Un second passage optionnel utilise le flux optique pour corriger d'éventuelles distorsions de forme.

Le projet a été développé par des chercheurs de Netflix en collaboration avec l'INSAIT Sofia University. Le code, l'article et la démo sont disponibles sur GitHub, arXiv et Hugging Face. Le système est distribué sous la licence Apache 2.0, ce qui signifie qu'il peut être utilisé commercialement.

Lire l'article original sur The Decoder

📧

Cet article vous a plu ?

Recevez les 7 meilleures actus IA chaque soir à 19h — résumées en 5 min.

Chaque soir à 19h

Gratuit · Pas de spam · Désabonnement en 1 clic

Commentaires