OpenAI a récemment présenté Sora, un nouveau modèle vidéo génératif impressionnant. Ce système est capable de convertir une brève description textuelle en une vidéo détaillée. Voici un aperçu des informations disponibles à son sujet.
Suite à l’annonce de la nouvelle IA Gemini 1.5 par Google, OpenAI a répliqué rapidement en dévoilant Sora, son premier outil capable de créer des vidéos d’une durée maximale d’une minute à partir de texte. Sora ne se limite pas à être une simple application de plus dans l’arsenal numérique, mais semble incarner les perspectives futures pour les créateurs et le grand public.
Effectivement, les performances de Runway AI, une technologie précédente capable de produire des vidéos de quelques secondes, étaient souvent caractérisées par des images floues, saccadées, distordues, voire perturbantes.
Mais qu’est-ce que Sora, la nouvelle IA révolutionnaire d’OpenAI ?
OpenAI a nommé son nouveau système Sora, en référence au mot japonais signifiant « ciel ». Selon l’équipe responsable de cette technologie, incluant les chercheurs Tim Brooks et Bill Peebles, ce choix de nom reflète l’idée d’un « potentiel créatif illimité ».
OpenAI a partagé quelques extraits vidéo produits par sa nouvelle intelligence artificielle, et les résultats sont véritablement impressionnants. Dans l’un de ces extraits, une scène décrit ainsi : « La magnifique ville enneigée de Tokyo est animée d’une grande activité. La caméra parcourt les rues bondées, suivant plusieurs personnes profitant du beau temps enneigé, faisant leurs emplettes dans les boutiques avoisinantes. De magnifiques pétales de sakura virevoltent dans le vent, accompagnant les flocons de neige ».
Conformément à la demande, la vidéo générée se déroule dans une rue de Tokyo, mettant en évidence la capacité de Sora à comprendre l’agencement tridimensionnel des objets. La caméra plonge ensuite dans la scène pour suivre un couple déambulant devant une rangée de magasins.
Les vidéos produites par l’outil d’OpenAI sont nettement plus convaincantes que celles offertes par d’autres outils existants, bien que l’on puisse parfois constater quelques imperfections mineures. Dans l’une de ces vidéos, où l’on observe une femme marchant dans la rue, il est par exemple notable sur quelques images que ses jambes ne suivent pas correctement le mouvement.
SORA N’EST PAS ENCORE ACCESSIBLE AU GRAND PUBLIC
Actuellement, Sora est toujours en phase de développement et n’est donc pas disponible pour le grand public. OpenAI a toutefois déjà distribué l’outil à certains universitaires et chercheurs, qui le soumettront à une évaluation par une « équipe rouge ». Ce groupe restreint est chargé d’explorer toutes les possibilités d’utilisation abusive de la technologie afin de mieux comprendre les risques associés à une telle avancée.
Les commentaires sont fermés.