OpenAI apresenta Sora: Modelo de IA que transforma textos em vídeos realistas

Compartilhe:

Tempo médio de leitura: 15 minutos
Sora IA

Disponível ainda apenas para os “Red Teamers”, nova IA da OpenIA promete gerar vídeos impressionantes de até 60 segundos baseados em prompts de comando

A OpenAI, empresa por trás do ChatGPT, introduziu um novo modelo de IA capaz de criar vídeos realistas através de inteligência artificial, a partir de textos. De acordo com a empresa, o Sora tem a habilidade de produzir vídeos de até 60 segundos baseados em descrições curtas. Inicialmente, apenas artistas visuais foram autorizados a utilizar essa ferramenta, explorando suas potencialidades para enriquecer suas criações.

Recentemente, Sam Altman (CEO da OpenAI) mencionou que em breve a inteligência artificial poderia viabilizar startups de bilhões de dólares sendo administradas por apenas uma pessoa. No entanto, após o anúncio feito ontem, é possível imaginar que essa startup de uma pessoa poderia se tornar um estúdio de cinema.

Mas afinal, como Sora funciona?

Segundo a própria OpenAI, “Sora entende não apenas o que o usuário pediu no prompt [comando], mas também como essas coisas existem no mundo físico”. Ela consegue gerar o vídeo, realizar movimentações de câmera complexos e ainda utilizar vários personagens na cena.

O Sora emprega uma abordagem conhecida como “difusão”, que gera imagens a partir de pontos aleatórios. No início do processo, o vídeo apresenta uma aparência parecida com ruído estático, que nos lembra das antigas TVs fora de sintonia. Gradualmente, esse visual se transforma em algo impressionante.


Essa técnica guarda semelhança com aquela utilizada por ferramentas capazes de criar imagens a partir de descrições fornecidas pelos usuários, como o DALL-E, também desenvolvido pela OpenAI e servindo como base para o desenvolvimento do Sora.

“[O Sora] usa a técnica de recaptação do (robô) DALL-E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo [Sora] é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado”, declara a OpenAI.

E como toda IA que gera conteúdo, basta o usuário fazer uso de “prompts” para que Sora gere os vídeos.

Sem previsão para o Brasil

A nova ferramenta, infelizmente, ainda não está liberada para o público em geral e, a OpenAI, ainda não informou uma data para que isso ocorra. Por enquanto, apenas o seu “Red teamers”, ou seja, “especialistas em áreas como desinformação, conteúdo de ódio e preconceito”, tiveram acesso à ferramenta com o intuito de testá-la e “refiná-la” para que a ferramenta não crie vídeos com desinformação ou elementos preconceituosos já que, como toda IA generativa, Sora se alimenta de vídeos e imagens pré-existentes na Internet.

Publicidade:


Primeiros resultados

Já que não é possível testar essa nova IA por enquanto, nos resta visualizar os resultados de prompts já testados! Vamos a eles:
– Obs: os prompts foram traduzidos para português para melhor entendimento.

  • Prompt: Uma ninhada de filhotes de golden retriever brincando na neve. Suas cabeças saltam da neve, cobertas.
  • Prompt: Close extremo do olho piscando de uma mulher de 24 anos, em pé em Marrakech durante a hora mágica, filmagem cinematográfica em 70mm, profundidade de campo, cores vivas, cinematográfico.
  • Prompt: Dica: uma sessão instrutiva de culinária para nhoque caseiro, apresentada por uma avó influenciadora de mídia social, ambientada em uma cozinha rústica toscana com iluminação cinematográfica.
  • Prompt: Dois golden retrievers fazendo podcast no topo de uma montanha.
  • Prompt: Passeio por uma galeria de arte com muitas obras de arte belíssimas em diferentes estilos.
  • Prompt: Um meio pato meio dragão voa através de um lindo pôr do sol com um hamster vestido com equipamento de aventura nas costas.
  • Prompt: Uma mulher estilosa caminha por uma rua de Tóquio cheia de neon brilhante e sinalização animada da cidade. Ela veste uma jaqueta de couro preta, um vestido longo vermelho e botas pretas, e carrega uma bolsa preta. Usa óculos de sol e batom vermelho. Caminha com confiança e descontração. A rua está úmida e reflexiva, criando um efeito de espelho das luzes coloridas. Muitos pedestres circulam.
  • Prompt: A câmera encara diretamente edifícios coloridos em Burano, Itália. Um adorável dálmata olha através de uma janela de um prédio no térreo. Muitas pessoas caminham e andam de bicicleta pelas ruas do canal em frente aos edifícios.

Nem tudo são flores

Com nada é 100% perfeito para as IA’s generativas, com Sora, essa afirmação também está correta. Segundo a OpenAI, o Sora pode ter dificuldade para reproduzir a física de uma cena complexa e pode não entender lógicas de causa e efeito. “Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito não ter marca de mordida”, explica.

“Concorrentes” do Sora

Essa nova IA, vem com o desafio de “brigar pelo seu lugar ao sol” com outras IA’s que possuem o mesmo propósito, como é o caso da ferramenta Pika Art que gera imagens de 3 segundos a partir de prompts ou da Videogen.

Concluindo…

A chegada do Sora, o novo modelo de inteligência artificial da OpenAI, abre portas para um mundo de possibilidades criativas. Ao transformar textos em vídeos realistas, o Sora demonstra o potencial da IA para revolucionar não apenas o campo do entretenimento, mas também diversos outros setores. Com sua capacidade de compreender e reproduzir elementos do mundo físico, o Sora promete trazer novas dimensões à produção audiovisual.

Embora ainda não disponível ao público em geral, os resultados iniciais impressionantes sugerem um futuro promissor para essa tecnologia. Contudo, como acontece com qualquer avanço tecnológico, existem desafios a serem enfrentados. A complexidade de reproduzir física realista e entender lógicas de causa e efeito são obstáculos que o Sora precisa superar.

Mesmo com esses desafios, a perspectiva de uma IA capaz de criar vídeos realistas a partir de simples descrições é empolgante. À medida que o Sora continua a ser refinado e desenvolvido, podemos esperar um impacto significativo não apenas na indústria cinematográfica, mas em todo o cenário criativo e tecnológico. O futuro da produção de conteúdo visual parece mais vibrante do que nunca, graças ao poder da inteligência artificial e ao potencial do Sora.

E você, também ficou impressionado(a) com os primeiros resultados de Sora? Comente abaixo o que achou.

Se você gostou desse artigo, talvez goste desses outros também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja outros artigos:

Casas 3D

Casas 3D: Georgetown, no Texas, recebe um bairro com 100 casas

Casas 3D incríveis construídas por impressoras chegam ao Texas em setembro. Bairro inovador com 100 residências. Residências espaçosas, com 3 a 4 quartos, 2 a 3 banheiros e painéis solares. Georgetown, a cidade escolhida, destaca-se como a melhor do sul dos EUA para se viver.