Au cours des dernières années, l’IA est devenue extrêmement populaire, en grande partie grâce à OpenAI. L’entreprise était responsable du chatbot ChatGPT et de DALL-E, un programme pour générer des images à l’aide de invites de texte.
Et OpenAI propose désormais le prochain programme d’IA. Le soi-disant Sora peut « créer des scènes réalistes et imaginatives basées sur des invites textuelles ». La société l’a fait savoir dans une annonce publiée sur son propre site Internet.
Selon OpenAI, le programme peut également comprendre comment les objets « existent dans le monde physique » et il peut « interpréter avec précision les objets et générer des personnages attrayants avec des émotions claires ». A titre d’exemple, la société a montré une femme marchant dans les rues de Tokyo et des mammouths se promenant dans un paysage enneigé.
Les pièges de l’IA
Bien que l’IA puisse souvent paraître très convaincante, il existe souvent quelques éléments permettant de reconnaître les images générées. Un problème connu, par exemple, est celui des mains. Les programmes comme DALL-E ont du mal à donner aux gens cinq doigts ou deux mains.
Avec Sora, ce problème ne semble pas encore complètement résolu. Par exemple, les exemples d’OpenAI montrent un certain nombre de problèmes « classiques » liés à l’intelligence artificielle. Par exemple, dans une vidéo d’un musée, le sol bouge.
OpenAI n’est pas la seule entreprise à disposer d’un programme de conversion texte-vidéo. Runway et Pika ont lancé des modèles similaires.