Netflix libera VOID, AI que entende física para edição de vídeo
-
Maicon Ramos
- 4 minutos de leitura
Navegue por tópicos
A Netflix lançou o VOID, um framework open-source de IA para edição de vídeo que vai além da remoção simples de objetos, simulando as consequências físicas na cena para maior realismo e controle.
- VOID usa máscaras especializadas que sinalizam objetos a remover e áreas afetadas fisicamente.
- O sistema prevê o comportamento de objetos removidos, como quedas ou flutuações.
- Disponível no Hugging Face desde 4 de abril de 2026.
- Mostra vantagens em testes contra outras ferramentas, mas tem limitações em física irregular e depende de dados sintéticos.
Lide
A Netflix, em colaboração com pesquisadores da Sofia University e INSAIT, anunciou em 4 de abril de 2026 o lançamento open-source do VOID (Video Object and Interaction Deletion), um inovador framework de inteligência artificial para edição de vídeo. Essa ferramenta permite remover objetos e simular de forma realista as consequências físicas dessa remoção nas cenas, como queda de objetos que perdem suporte ou ondas que desaparecem em piscinas ao retirarem um mergulhador. O VOID já está disponível para download na plataforma Hugging Face, podendo ser utilizado por profissionais independentes e estúdios, sem restrições vinculadas à Netflix.
Como funciona o VOID
O diferencial do VOID é sua capacidade de compreender e simular interações físicas dentro do vídeo, indo muito além do simples preenchimento de pixels (inpainting). A tecnologia está baseada na arquitetura CogVideoX-Fun-V1.5-5b-InP, um modelo de vídeo 3D Transformer com 5 bilhões de parâmetros, originalmente criado pela Alibaba e ajustado para a tarefa de edição consciente da física.
- Uma máscara especial chamada quadmask codifica a cena em quatro valores para indicar o objeto a remover, áreas sobrepostas, regiões afetadas fisicamente e o fundo a manter.
- O framework utiliza um pipeline de inferência em duas etapas: a primeira remove o objeto e os efeitos físicos básicos; a segunda corrige distorções complexas, como deformações temporais em objetos.
- Entrada do sistema inclui tanto o vídeo quanto descrições textuais dos objetos a serem removidos, associando visão e linguagem para melhor precisão.
Resultados e Avaliações
Testes comparativos indicam que o VOID supera outras ferramentas populares de edição, como Runway e DiffuEraser, com preferência de 64,8% dos avaliadores humanos. A capacidade de simular efeitos físicos complexos Realista, como balanços de objetos e interações de suporte gravitacional, destaca-se como um avanço relevante para a indústria audiovisual.
Limitações e Criticas
- O modelo depende da segunda etapa do pipeline para evitar erros visuais como morphing.
- Baseia-se em dados sintéticos para treinamento, o que pode limitar seu desempenho em dinâmicas físicas irregulares, especialmente tecidos e fluidos orgânicos.
- O paper ainda é um preprint não revisado por pares, o que indica a necessidade de mais testes para validar a robustez do método.
- Existe o risco ético associado à facilidade de manipulação de vídeos com realismo convincente, ampliando potencial para desinformações e deepfakes.
- Netflix não tem planos anunciados para integrar a ferramenta em suas produções, liberando-a para uso geral.
Impactos no setor audiovisual
Com o VOID, a edição de vídeo pode se tornar mais eficiente, reduzindo a necessidade de reshoots e agilizando processos em pós-produção, o que pode diminuir custos em até 50-80% em correções simples. A democratização do acesso pelo lançamento open-source deve ampliar a competição entre estúdios e fortalecer atores independentes, enquanto levanta debates sobre mudanças no papel dos profissionais tradicionais em efeitos visuais.
Mídia
Veja uma demonstração rápida do VOID no vídeo oficial da Netflix Research no YouTube:
Mais informações e acesso ao código estão disponíveis no site oficial do projeto VOID.









