Produtos mais vendidos na Black Friday Amazon 2024

Conheça o Relógio da Morte e como ele funciona

Como usar o modo voz do ChatGPT no celular

5 melhores jogos offline para celular

AI tips

OpenAI presents Sora: AI model that turns texts into realistic videos

By: Filipe Reis
16/02/2024

Share:

Tempo médio de leitura: 15 minutos

Nesse artigo:

Disponível ainda apenas para os “Red Teamers”, nova IA da OpenIA promete gerar vídeos impressionantes de até 60 segundos baseados em prompts de comando

A OpenAI, empresa por trás do ChatGPT, introduziu um novo modelo de IA capaz de criar vídeos realistas através de inteligência artificial, a partir de textos. De acordo com a empresa, o Sora tem a habilidade de produzir vídeos de até 60 segundos baseados em descrições curtas. Inicialmente, apenas artistas visuais foram autorizados a utilizar essa ferramenta, explorando suas potencialidades para enriquecer suas criações.

Recentemente, Sam Altman (CEO da OpenAI) mencionou que em breve a inteligência artificial poderia viabilizar startups de bilhões de dólares sendo administradas por apenas uma pessoa. No entanto, após o anúncio feito ontem, é possível imaginar que essa startup de uma pessoa poderia se tornar um estúdio de cinema.

Mas afinal, como Sora funciona?

Segundo a própria OpenAI, “Sora entende não apenas o que o usuário pediu no prompt [comando], mas também como essas coisas existem no mundo físico”. Ela consegue gerar o vídeo, realizar movimentações de câmera complexos e ainda utilizar vários personagens na cena.

O Sora emprega uma abordagem conhecida como “difusão”, que gera imagens a partir de pontos aleatórios. No início do processo, o vídeo apresenta uma aparência parecida com ruído estático, que nos lembra das antigas TVs fora de sintonia. Gradualmente, esse visual se transforma em algo impressionante.

Essa técnica guarda semelhança com aquela utilizada por ferramentas capazes de criar imagens a partir de descrições fornecidas pelos usuários, como o DALL-E, também desenvolvido pela OpenAI e servindo como base para o desenvolvimento do Sora.

“[O Sora] usa a técnica de recaptação do (robô) DALL-E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo [Sora] é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado”, declara a OpenAI.

E como toda IA que gera conteúdo, basta o usuário fazer uso de “prompts” para que Sora gere os vídeos.

Sem previsão para o Brasil

A nova ferramenta, infelizmente, ainda não está liberada para o público em geral e, a OpenAI, ainda não informou uma data para que isso ocorra. Por enquanto, apenas o seu “Red teamers”, ou seja, “especialistas em áreas como desinformação, conteúdo de ódio e preconceito”, tiveram acesso à ferramenta com o intuito de testá-la e “refiná-la” para que a ferramenta não crie vídeos com desinformação ou elementos preconceituosos já que, como toda IA generativa, Sora se alimenta de vídeos e imagens pré-existentes na Internet.

Publicidade:

Primeiros resultados

Já que não é possível testar essa nova IA por enquanto, nos resta visualizar os resultados de prompts já testados! Vamos a eles:
– Obs: os prompts foram traduzidos para português para melhor entendimento.

Prompt: Uma ninhada de filhotes de golden retriever brincando na neve. Suas cabeças saltam da neve, cobertas.

Prompt: A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in. pic.twitter.com/G1qhJRV9tg
— Eduardo Borges (@duborges) February 15, 2024

Prompt: Close extremo do olho piscando de uma mulher de 24 anos, em pé em Marrakech durante a hora mágica, filmagem cinematográfica em 70mm, profundidade de campo, cores vivas, cinematográfico.

Prompt: Dica: uma sessão instrutiva de culinária para nhoque caseiro, apresentada por uma avó influenciadora de mídia social, ambientada em uma cozinha rústica toscana com iluminação cinematográfica.

https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024

Prompt: Dois golden retrievers fazendo podcast no topo de uma montanha.

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024

Prompt: Passeio por uma galeria de arte com muitas obras de arte belíssimas em diferentes estilos.

Prompt: Um meio pato meio dragão voa através de um lindo pôr do sol com um hamster vestido com equipamento de aventura nas costas.

https://t.co/WJQCMEH9QG pic.twitter.com/Qa51e18Vph
— Sam Altman (@sama) February 15, 2024

Prompt: Uma mulher estilosa caminha por uma rua de Tóquio cheia de neon brilhante e sinalização animada da cidade. Ela veste uma jaqueta de couro preta, um vestido longo vermelho e botas pretas, e carrega uma bolsa preta. Usa óculos de sol e batom vermelho. Caminha com confiança e descontração. A rua está úmida e reflexiva, criando um efeito de espelho das luzes coloridas. Muitos pedestres circulam.

Prompt: A câmera encara diretamente edifícios coloridos em Burano, Itália. Um adorável dálmata olha através de uma janela de um prédio no térreo. Muitas pessoas caminham e andam de bicicleta pelas ruas do canal em frente aos edifícios.

All of these UNBELIEVABLE videos were created using Sora, the new AI model from OpenAI

Watch each one and see how it makes you feel…

I don't think it's crazy for me to say this going to shift Hollywood, social apps and media forever

Video #1
Prompt: The camera directly faces… pic.twitter.com/NJfphtGbWb
— GREG ISENBERG (@gregisenberg) February 15, 2024

Nem tudo são flores

Com nada é 100% perfeito para as IA’s generativas, com Sora, essa afirmação também está correta. Segundo a OpenAI, o Sora pode ter dificuldade para reproduzir a física de uma cena complexa e pode não entender lógicas de causa e efeito. “Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas depois o biscoito não ter marca de mordida”, explica.

“Concorrentes” do Sora

Essa nova IA, vem com o desafio de “brigar pelo seu lugar ao sol” com outras IA’s que possuem o mesmo propósito, como é o caso da ferramenta Pika Art que gera imagens de 3 segundos a partir de prompts ou da Videogen.

Concluindo…

A chegada do Sora, o novo modelo de inteligência artificial da OpenAI, abre portas para um mundo de possibilidades criativas. Ao transformar textos em vídeos realistas, o Sora demonstra o potencial da IA para revolucionar não apenas o campo do entretenimento, mas também diversos outros setores. Com sua capacidade de compreender e reproduzir elementos do mundo físico, o Sora promete trazer novas dimensões à produção audiovisual.

Embora ainda não disponível ao público em geral, os resultados iniciais impressionantes sugerem um futuro promissor para essa tecnologia. Contudo, como acontece com qualquer avanço tecnológico, existem desafios a serem enfrentados. A complexidade de reproduzir física realista e entender lógicas de causa e efeito são obstáculos que o Sora precisa superar.

Mesmo com esses desafios, a perspectiva de uma IA capaz de criar vídeos realistas a partir de simples descrições é empolgante. À medida que o Sora continua a ser refinado e desenvolvido, podemos esperar um impacto significativo não apenas na indústria cinematográfica, mas em todo o cenário criativo e tecnológico. O futuro da produção de conteúdo visual parece mais vibrante do que nunca, graças ao poder da inteligência artificial e ao potencial do Sora.

E você, também ficou impressionado(a) com os primeiros resultados de Sora? Comente abaixo o que achou.

Se você gostou desse artigo, talvez goste desses outros também:

Boneco Lego: Crie e anime o seu agora! – Nosso guia mostrará como utilizar o Criador de Imagens do Bing para dar vida a um boneco Lego e, em seguida, transformá-lo em uma animação cativante.
Pixar-style 3D characters and Funko dolls: Learn how to create! – Crie desenhos 3D estilo Pixar e bonecos Funko no Bing. Posicione sobre logos do Instagram/YouTube e adicione seu rosto!
Ideogram: Produce images with texts – Descubra o Ideogram, uma ferramenta IA que transforma texto em imagens visuais, incluindo a capacidade única de gerar imagens contendo textos.
Criador de Imagens do Microsoft Bing: Tudo o que você precisa saber – Como gerar imagens com IA a partir de descrições em texto. O Criador de Imagens do Microsoft Bing (Bing Create Image, em inglês).

Filipe Reis

Graduation, post-graduation, that sort of thing... I've always liked technology and I love learning new things and passing that knowledge on! I also like rock music and fiction movies (the kind you watch for 5 minutes, go to sleep and watch the final 5 minutes and understand the whole movie)!

Leave a Reply Cancel reply

See other articles:

Otimize seu PC para jogos

Otimize seu PC para jogos: Dicas práticas de desempenho

Otimize seu PC para jogos com dicas de configuração e upgrades que melhoram o desempenho.

Prompt de Comando

Command Prompt: Practical examples of using ChatGPT

Intuitive Command Prompt can increase your productivity with ChatGPT. Explore practical examples in areas such as business and entertainment.

Remodeled.ai

Remodeled.ai: The AI that transforms home design

Remodeled.ai: veja como essa plataforma de IA gera ideias inovadoras de design para a remodelação de salas e quartos, tornando o processo mais acessível e intuitivo.

E-commerce no Brasil: as melhores plataformas para vender online

E-commerce in Brazil: the 10 best platforms for selling online

E-commerce in Brazil: the market is growing and e-commerce platforms are essential for those who want to sell online. Learn how to choose yours!

Mouse: A complete guide to choosing the right one

The mouse, that little device we use every day to interact with our computers, is an essential piece of our technology kit.

PC Builds

PC BUILDS: Test the ideal setup for building your new PC

PC Builds is a tool that promises to help you decide on the main components such as processor, video card and screen resolution.