Même la Joconde peut rapper grâce à cet outil d'IA basé sur une image - Gamerush

Même la Joconde peut rapper grâce à cet outil d’IA basé sur une image

Un nouvel outil d’IA donne vie à vos images avec du chant, du rap et des dialogues

Imaginez un monde où une simple image peut être transformée en un avatar chantant, parlant ou même rappant. C’est exactement ce que propose un nouvel outil d’IA, capable de créer des avatars animés à partir d’une seule image. Et même la Mona Lisa n’est pas à l’abri de cracher des vers !

EMO : Emote Portrait Alive, l’outil qui anime vos images

Le nouvel outil d’IA, appelé EMO : Emote Portrait Alive, a été développé par plusieurs chercheurs de l’Institut pour l’Informatique Intelligente, une partie du groupe Alibaba. Il prend une seule image de référence, extrait des images animées, puis les combine avec de l’audio vocal grâce à un processus de diffusion complexe. Le résultat est un avatar animé qui non seulement synchronise les lèvres, mais exprime également diverses expressions faciales et poses de tête.

Des avatars plus vrais que nature

La technologie est démontrée en utilisant des images d’échantillons de diverses figures allant de célébrités réelles, à des personnes générées par IA, jusqu’à la Mona Lisa. L’audio vocal utilisé comprend une piste de Dua Lipa, des clips d’interview pré-enregistrés et des monologues shakespeariens. Après l’application du processus, l’avatar généré semble prendre vie, bougeant et parlant en synchronisation avec l’audio choisi.

Des performances « cross-actor » impressionnantes

Encore plus impressionnant est une démonstration ultérieure de ce que l’entreprise appelle une « performance cross-actor ». Un clip montre Joaquin Phoenix maquillé en Joker, mais cette fois avec l’audio de l’interprétation du personnage par Heath Ledger dans The Dark Knight, y compris une approximation raisonnable des tics de Ledger dans le rôle.

Les implications de cette technologie

Alors que la technologie est indéniablement impressionnante, elle est susceptible de renforcer l’idée que le contenu deepfake généré par l’IA, et tous les usages néfastes potentiels qu’il peut avoir, progresse à un rythme remarquable. Les outils d’IA peuvent parfois démontrer une capacité terrifiante à produire du contenu généré à un rythme incroyable et avec une complexité croissante, ce qui a des implications troublantes.

Conclusion

Il ne sera peut-être pas long avant que nos photos de vacances puissent être saisies sur nos pages Facebook longtemps défuntes, pour être transformées par des outils d’IA en vidéos de nous chantant des chansons que nous n’avons jamais chantées. Mais ne vous inquiétez pas, si vous voyez une vidéo de moi en train de faire du karaoké en état d’ébriété à Chypre, c’est un faux amélioré par l’IA, je vous le promets.

Si vous voulez suivre l’actualité des jeux vidéos et du streaming, rejoignez la newsletter Gamerush.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut