Com as ferramentas disponíveis atualmente, é possível criar vídeos extremamente realistas a partir de comandos em texto.
Um exemplo notável é um vídeo de um canguru de apoio emocional que foi barrado de um voo, alcançando rapidamente mais de 11 milhões de visualizações. Esse conteúdo, que incluía uma advertência de que se tratava de uma produção gerada por inteligência artificial, provocou um debate crescente sobre a autenticidade de vídeos criados por essa tecnologia. O evento ocorreu logo após o lançamento do Veo 3 pelo Google, uma ferramenta que tem gerado uma grande quantidade de vídeos ultrarrealistas na internet.
As ferramentas de criação de vídeo não apenas impressionam pela sofisticação técnica, mas também pela capacidade de replicar emoções, movimentos de câmera e expressões faciais com alto grau de realismo. É crucial estar ciente do potencial significativo de desinformação e uso inadequado dessas tecnologias, especialmente na confecção de deepfakes que parecem muito autênticas. Eventos fictícios ou declarações fabricadas de figuras públicas podem se espalhar como se fossem reais. Apesar de o Veo 3 ter restrições, como a proibição da geração de vídeos com figuras públicas, essas limitações podem não ocorrer ou serem facilmente contornadas em outras ferramentas.
Um especialista em tecnologia destacou que, conforme se torna mais desafiador distinguir entre o real e o gerado por inteligência artificial, a credibilidade das informações está em jogo. Isso impacta não apenas o jornalismo e as instituições democráticas, mas também a confiança nas interações digitais.
Em um contexto de novas possibilidades trazidas pela inteligência artificial, surgem desafios e riscos. Os vídeos ultrarrealistas gerados por IA iniciam uma nova era de manipulação, onde as barreiras entre o que é real e o que é gerado se tornam indistintas com rapidez alarmante.
Os vídeos sintéticos têm o potencial de manipular a opinião pública, instigar violência e fraudar processos eleitorais, além de possibilitar golpes financeiros. Jornalistas demonstraram essa vulnerabilidade ao criar vídeos fictícios que simulavam rebeliões e fraudes eleitorais. A responsabilidade dos criadores de conteúdo nunca foi tão significativa. As diretrizes éticas exigem que não se utilizem rostos reais sem consentimento e que não haja apropriação indevida da identidade visual de artistas.
Informações recentes indicam que 96% dos criadores de conteúdo no Brasil já fazem uso de ferramentas de IA generativa. Além disso, mais de 90% dos brasileiros digitados utilizam essa tecnologia de maneira frequente. Especialistas alertam que a manipulação de vozes e imagens se torna mais acessível com a presença dos deepfakes, facilitando fraudes e falsas acusações. O “ver para crer” pode deixar de ter validade, levando a uma crise de confiança nas informações.
O impacto dos vídeos ultrarrealistas pode desafiar estruturas sociais e políticas, dificultando a construção de um consenso a partir da verdade. Eles são ferramentas que podem ser utilizadas para extorsão e manipulação, ao mesmo tempo em que é necessário considerar a concentração de poder nas mãos de quem controla essas tecnologias.
O PL 2.338/23, que propõe um Marco Legal da Inteligência Artificial no Brasil, está atualmente em tramitação. O projeto visa estabelecer diretrizes para o uso responsável da IA, enfatizando a importância de princípios éticos e transparência. Uma das inovações sugere que vídeos criados com conteúdo protegido por direitos autorais tenham suas fontes claramente mencionadas.
É desejável que as organizações deixem claro quando um conteúdo foi gerado por inteligência artificial, especialmente em casos com potencial confuso. Embora algumas ferramentas incluam marcações digitais para indicar a origem dos vídeos, a eficácia dessas sinalizações é limitada.
As plataformas de tecnologia afirmam estar cientes do impacto da inteligência artificial e que estão tomando medidas para evitar seu uso indevido. O Google ressalta a importância da colaboração entre governos, empresas e a sociedade civil na definição de normas que regulem a utilização responsável da informática.
Diversas ferramentas de vídeos gerados por inteligência artificial já se destacam no mercado. Entre elas, destaca-se a Visual Electric, voltada para designers e conhecida pela qualidade estética, e a Kling V2.1, reconhecida pela fluidez e realismo na transformação de imagens estáticas em vídeos dinâmicos.
O Veo 3, do Google, impressiona pela sua capacidade de sincronização labial e efeitos sonoros realistas. Embora tenha limitações em narrativas complexas, é altamente eficaz em criar experiências imersivas. A Flora, com sua abordagem multimodal, permite que usuários integrem diferentes tipos de mídia de maneira intuitiva. Por fim, o Sora, da OpenAI, é conhecido por gerar cenas complexas com vários personagens enquanto mantém a qualidade visual desejada.