Sora IA

Disponível ainda apenas para os “Red Teamers”, nova IA da OpenIA promete gerar vídeos impressionantes de até 60 segundos baseados em prompts de comando

A OpenAI, empresa por trás do ChatGPT, introduziu um novo modelo de IA capaz de criar vídeos realistas através de inteligência artificial, a partir de textos. De acordo com a empresa, o Sora tem a habilidade de produzir vídeos de até 60 segundos baseados em descrições curtas. Inicialmente, apenas artistas visuais foram autorizados a utilizar essa ferramenta, explorando suas potencialidades para enriquecer suas criações.

Recentemente, Sam Altman (CEO da OpenAI) mencionou que em breve a inteligência artificial poderia viabilizar startups de bilhões de dólares sendo administradas por apenas uma pessoa. No entanto, após o anúncio feito ontem, é possível imaginar que essa startup de uma pessoa poderia se tornar um estúdio de cinema.

Mas afinal, como Sora funciona?

Segundo a própria OpenAI, “Sora entende não apenas o que o usuário pediu no prompt [comando], mas também como essas coisas existem no mundo físico”. Ela consegue gerar o vídeo, realizar movimentações de câmera complexos e ainda utilizar vários personagens na cena.

O Sora emprega uma abordagem conhecida como “difusão”, que gera imagens a partir de pontos aleatórios. No início do processo, o vídeo apresenta uma aparência parecida com ruído estático, que nos lembra das antigas TVs fora de sintonia. Gradualmente, esse visual se transforma em algo impressionante.

[code_snippet id=10 format]

Essa técnica guarda semelhança com aquela utilizada por ferramentas capazes de criar imagens a partir de descrições fornecidas pelos usuários, como o DALL-E, também desenvolvido pela OpenAI e servindo como base para o desenvolvimento do Sora.

“[O Sora] usa a técnica de recaptação do (robô) DALL-E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo [Sora] é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado”, declara a OpenAI.

E como toda IA que gera conteúdo, basta o usuário fazer uso de “prompts” para que Sora gere os vídeos.

Sem previsão para o Brasil

A nova ferramenta, infelizmente, ainda não está liberada para o público em geral e, a OpenAI, ainda não informou uma data para que isso ocorra. Por enquanto, apenas o seu “Red teamers”, ou seja, “especialistas em áreas como desinformação, conteúdo de ódio e preconceito”, tiveram acesso à ferramenta com o intuito de testá-la e “refiná-la” para que a ferramenta não crie vídeos com desinformação ou elementos preconceituosos já que, como toda IA generativa, Sora se alimenta de vídeos e imagens pré-existentes na Internet.

[code_snippet id=8 format]

Primeiros resultados

Já que não é possível testar essa nova IA por enquanto, nos resta visualizar os resultados de prompts já testados! Vamos a eles:
– Obs: os prompts foram traduzidos para português para melhor entendimento.

  • Prompt: Uma ninhada de filhotes de golden retriever brincando na neve. Suas cabeças saltam da neve, cobertas.
  • Prompt: Close extremo do olho piscando de uma mulher de 24 anos, em pé em Marrakech durante a hora mágica, filmagem cinematográfica em 70mm, profundidade de campo, cores vivas, cinematográfico.
  • Prompt: Dica: uma sessão instrutiva de culinária para nhoque caseiro, apresentada por uma avó influenciadora de mídia social, ambientada em uma cozinha rústica toscana com iluminação cinematográfica.
  • Prompt: Dois golden retrievers fazendo podcast no topo de uma montanha.
  • Prompt: Passeio por uma galeria de arte com muitas obras de arte belíssimas em diferentes estilos.
  • Prompt: Um meio pato meio dragão voa através de um lindo pôr do sol com um hamster vestido com equipamento de aventura nas costas.
  • Prompt: Uma mulher estilosa caminha por uma rua de Tóquio cheia de neon brilhante e sinalização animada da cidade. Ela veste uma jaqueta de couro preta, um vestido longo vermelho e botas pretas, e carrega uma bolsa preta. Usa óculos de sol e batom vermelho. Caminha com confiança e descontração. A rua está úmida e reflexiva, criando um efeito de espelho das luzes coloridas. Muitos pedestres circulam.
  • Prompt: A câmera encara diretamente edifícios coloridos em Burano, Itália. Um adorável dálmata olha através de uma janela de um prédio no térreo. Muitas pessoas caminham e andam de bicicleta pelas ruas do canal em frente aos edifícios.

Nem tudo são flores

Com nada é 100% perfeito para as IA’s generativas, com Sora, essa afirmação também está correta. Segundo a OpenAI, o Sora pode ter dificuldade para reproduzir a física de uma cena complexa e pode não entender lógicas de causa e efeito. “Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito não ter marca de mordida”, explica.

“Concorrentes” do Sora

Essa nova IA, vem com o desafio de “brigar pelo seu lugar ao sol” com outras IA’s que possuem o mesmo propósito, como é o caso da ferramenta Pika Art que gera imagens de 3 segundos a partir de prompts ou da Videogen.

Concluindo…

A chegada do Sora, o novo modelo de inteligência artificial da OpenAI, abre portas para um mundo de possibilidades criativas. Ao transformar textos em vídeos realistas, o Sora demonstra o potencial da IA para revolucionar não apenas o campo do entretenimento, mas também diversos outros setores. Com sua capacidade de compreender e reproduzir elementos do mundo físico, o Sora promete trazer novas dimensões à produção audiovisual.

Embora ainda não disponível ao público em geral, os resultados iniciais impressionantes sugerem um futuro promissor para essa tecnologia. Contudo, como acontece com qualquer avanço tecnológico, existem desafios a serem enfrentados. A complexidade de reproduzir física realista e entender lógicas de causa e efeito são obstáculos que o Sora precisa superar.

Mesmo com esses desafios, a perspectiva de uma IA capaz de criar vídeos realistas a partir de simples descrições é empolgante. À medida que o Sora continua a ser refinado e desenvolvido, podemos esperar um impacto significativo não apenas na indústria cinematográfica, mas em todo o cenário criativo e tecnológico. O futuro da produção de conteúdo visual parece mais vibrante do que nunca, graças ao poder da inteligência artificial e ao potencial do Sora.

E você, também ficou impressionado(a) com os primeiros resultados de Sora? Comente abaixo o que achou.

Se você gostou desse artigo, talvez goste desses outros também:

Tags: | | | | | | | | | | | | | | | | | |

Sobre o Autor

Filipe Reis
Filipe Reis

Com graduação, pós, essas coisas... Gosto de tecnologia desde sempre e adoro aprender coisas novas e passar esse conhecimento para frente! Também gosto de rock e filmes de ficção (daqueles que você assiste 5 min, dorme e assiste os 5 min finais e entende o filme inteiro)!

    0 Comentários

    Deixe um comentário

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *