O quase das ferramentas de vídeo de inteligência artificial
Relato de uma experiência com ferramentas IA de vídeo acessíveis para pequenas empresas de jornalismo
Fazer vídeos não é a minha praia. No entanto, como empreendedores, precisamos nos arriscar em novas frentes, mesmo que o resultado inicial pareça amador. Sem dúvida, produzir vídeos, falar em público e vender estão na lista das minhas dez maiores dificuldades.
Dito isso, a ideia de testar o formato surgiu ao concluir a publicação da série “Como a IA está transformando as redações”. Percebi que poderíamos usar mais ferramentas de IA para promover o conteúdo. Mostrei para o Lucio Mesquita, responsável pela série, o primeiro resultado. Ele não apenas incentivou, como também sugeriu o compartilhamento deste texto.
Embora o apoio da IA para tarefas cotidianas já faça parte da nossa rotina, a produção audiovisual sempre dependeu de especialistas — e vale o registro: nada substitui o olhar e a qualidade técnica de um profissional. No entanto, o objetivo desta experiência não era a perfeição técnica, mas sim validar o processo por meio de ferramentas acessíveis a leigos.
Iniciei a busca por soluções que transformam texto em vídeo, priorizando o modelo freemium (com limites de uso gratuito) em vez do sistema de trial (que exige cartão de crédito para testes curtos, em geral, de 3 a 7 dias). O desafio era criar o produto final utilizando apenas uma plataforma.
Mais familiaridade
Comecei pelo NotebookLM, ferramenta que já utilizo para organizar documentos e relatórios. No ambiente de criação, inseri um prompt genuíno, sem estruturar detalhes complexos. Para minha surpresa, o resultado superou as expectativas, apesar de alguns erros pontuais e um sotaque português, que até dava graça.
Foram seis rodadas para refinar o prompt, indicando tempo de vídeo, voz do locutor, frases, imagem de referência. Porém, sempre tinha algo que, apesar dos comandos, não era realizado. Fiquei com o vídeo abaixo, que não é perfeito, mas ficou convincente para o propósito.
A única intervenção externa foi a inclusão da logomarca da Innovation Media em um editor de vídeo convencional.
O processo
O “quase” do teste anterior me deixou mais do que curiosa, um pouco obsessiva, cheguei até a esquecer de pedir a marmita do meu filho na escola, só me dei conta quando ele me ligou.
Neste dia, percorri mais de dez ferramentas para tentar chegar ao resultado mais profissional voltado ao público de jornalistas. Além de consultar a listagem da Innovation Media (Parte 7), fiz a pesquisa no “There’s an IA for that” e no próprio ChatGPT.
Com exceção do NotebookLM, que fiz o upload do conteúdo na íntegra, nenhuma das opções permitia colocar (gratuitamente) um prompt extenso, que já tinha desenvolvido do vídeo anterior. Desta forma, investi meu tempo nas ferramentas que permitiam o prompt de, ao menos, 1.500 caracteres.
Vou citar algumas das minhas experiências para ilustrar os problemas mais comuns:
- Render Forest: Entregou um vídeo de 25 segundos com imagens descontextualizadas da narrativa e até meio bizarras, insistindo em inserir bandeiras do Brasil em cenas aleatórias.
- Veo (Google/Gemini): Apesar de solicitar 30 segundos, a ferramenta entregou apenas 5. O resultado apresentou erros de narrativa e as típicas falhas visuais de IA, como textos com caracteres ilegíveis.
- Fliki: Surpreendeu positivamente na geração do áudio e permitiu cobrir a locução com imagens de arquivo (upload) ou geradas por IA na timeline. No entanto, o processo foi interrompido quando os créditos gratuitos acabaram, impedindo o download.
- Heygen: Fez um ótimo trabalho, sem necessidade de ajustes, com upload de imagens de referência e legendas corretas. Contudo, o estilo assemelha-se mais a um material de divulgação do que a uma peça informativa.
- Descript: Já utilizada em diversas redações globais, mostrou-se a opção mais interativa. Permite ajustes de imagem e voz na timeline e oferece um banco de imagens (embora as ilustrações pareçam infantis). Não consegui finalizar por falta de créditos, mas permitiu exportar o resultado incompleto.
Resumo da ópera
É quase impossível que redações pequenas ou jornalistas independentes ("redações de um só") tenham talento, tempo e orçamento suficientes para atender todas as suas necessidades profissionais. Mas está mais fácil começar com as novas tecnologias de IA. Embora não resolvam todos os problemas nem sirvam para todos os contextos, essas tecnologias oferecem um caminho fértil para quem usa a criatividade e tem disposição para experimentar.
A segunda constatação, em formato de pergunta, talvez seja menos óbvia:
É evidente que as ferramentas de IA alucinam e são treinadas conforme o uso constante, mas será que a sensação de “quase” sempre fará parte do jogo financeiro das IAs?


![Parte 7 [Final]: Como a IA está transformando as redações no mundo](/apidata/imgcache/a3c31b4ec7870ed8efd8f3a0122427a7.jpeg)


