Το Netflix μπαίνει στην αρένα του Open Source AI: Δωρεάν το VOID, το εργαλείο που «ξαναγράφει» τη φυσική στα βίντεο
Το Netflix κάνει το ντεμπούτο του στην AI κοινότητα με το VOID (Video Object and Interaction Deletion), ένα πλαίσιο που ξεπερνά την απλή διαγραφή στοιχείων και εστιάζει στην αποκατάσταση των φυσικών επιπτώσεων που προκύπτουν μετά την αφαίρεσή τους. Το σύστημα διατίθεται πλέον ελεύθερα με την άδεια Apache 2.0, επιτρέποντας σε προγραμματιστές και παραγωγούς να το ενσωματώσουν στις δικές τους ροές εργασίας.
Πώς το VOID αλλάζει τα δεδομένα Ενώ τα παραδοσιακά εργαλεία περιορίζονται στο να γεμίζουν τα κενά με στατικό φόντο, το VOID διαχειρίζεται σύνθετα σενάρια φυσικής. Για παράδειγμα, αν αφαιρεθεί ένα όχημα από μια σκηνή σύγκρουσης, το μοντέλο δημιουργεί υλικό όπου το υπόλοιπο αυτοκίνητο συνεχίζει αδιατάρακτα, εξαφανίζοντας συντρίμμια και καπνό. Αντίστοιχα, στην αφαίρεση ενός ατόμου που βουτά σε πισίνα, η επιφάνεια του νερού αναδομείται χωρίς κανένα πιτσίλισμα.
Για την επίτευξη αυτού του αποτελέσματος, το Netflix αξιοποίησε μια αλυσίδα πολλαπλών μοντέλων, συμπεριλαμβανομένου του CogVideoX ως βάση και του Gemini 3 Pro της Google για την ανάλυση των σκηνών. Το σύστημα χρησιμοποιεί μια αλυσίδα συλλογισμού όρασης-γλώσσας και την τεχνολογία “quadmask” για να καθοδηγήσει τη διαδικασία συμπλήρωσης της εικόνας.
Συνεργασία και αναγνώριση Το έργο είναι καρπός συνεργασίας μεταξύ ερευνητών του Netflix (Saman Motamed, William Harvey, Benjamin Klein, Zhuoning Yuan, Ta-Ying Cheng) και του Luc Van Gool από το INSAIT του Πανεπιστημίου της Σόφιας. Σύμφωνα με έρευνα στην οποία συμμετείχαν 25 άτομα, το VOID προτιμήθηκε κατά 64,8% έναντι ανταγωνιστικών προσεγγίσεων, όπως το Runway, το οποίο συγκέντρωσε μόλις το 18,4%.
Πρόσβαση για όλους Θέλοντας να στηρίξει την ανοιχτή πρόσβαση στην τεχνολογία, το Netflix δημοσίευσε τον κώδικα, την επιστημονική εργασία και μια διαδραστική επίδειξη στις πλατφόρμες GitHub, arXiv και Hugging Face. Σημειώνεται ότι για την εκτέλεση του μοντέλου απαιτείται GPU με τουλάχιστον 40GB VRAM. Παρά τη διάθεση του εργαλείου στο κοινό, η εταιρεία διευκρίνισε ότι προς το παρόν δεν έχει σχέδια ενσωμάτωσης του VOID στις δικές της εσωτερικές γραμμές παραγωγής.