Accueil Série TV Vidéo de chant Scat de Kim Cattrall : clip restauré par logiciel AI

Vidéo de chant Scat de Kim Cattrall : clip restauré par logiciel AI

0
Vidéo de chant Scat de Kim Cattrall : clip restauré par logiciel AI

La plupart d’entre nous ont discrètement réduit nos passe-temps liés au confinement, mais le créateur Internet Teigan Reamsbottom se lève toujours à 4 heures du matin pour organiser des clips vidéo de culture pop classiques du camp. Il fait également de son mieux pour améliorer la qualité vidéo en utilisant un ordinateur de jeu dédié, rempli de RAM et une suite logicielle qui utilise des algorithmes d’apprentissage automatique pour préserver les caractéristiques d’origine des clips.

Dans un monde où les films peuvent disparaître pour cause de déductions fiscales et où les supports physiques peuvent être rares, il est réconfortant de voir des artefacts de la culture pop découverts – même si cela signifie qu’aucune célébrité des années 80 ou 90 n’est en sécurité.

Pièce A : à l’apogée de « Sex and the City », une interview de Kim Cattrall où elle chante pendant que son mari d’alors, Mark, joue de la contrebasse. Le clip est depuis longtemps présent sur Internet (il a déjà fait l’objet d’une exposition à la galerie THNK1994 du Lower East Side). C’est un excellent exemple de l’œil de Reamsbottom pour le camp délicieusement désarticulé et parfois grinçant d’un monde pré-TikTok. Et dans un certain secteur d’Internet, sa restauration était un sujet de réjouissance. Regardez la version restaurée par rapport au clip flou qui nous obsède depuis des années ci-dessous :

Martin Scorsese à la Vanity Fair Oscar Party 2024 qui s'est tenue au Wallis Annenberg Center for the Performing Arts le 10 mars 2024 à Beverly Hills, en Californie.  (Photo de Christopher Polk/Variété via Getty Images)
Nous étions les plus chanceux – « Radom » – Épisode 101 – La famille Kurc célèbre la Pâque à Radom, en Pologne.  Un an plus tard, le début de la Seconde Guerre mondiale entraîne une séparation dévastatrice.  Halina (Joey King), illustrée.  (Photo par : Vlad Cioplea/Hulu)

Cependant, la mise à l’échelle de la vidéo – améliorer sa qualité afin qu’un clip puisse s’adapter à nos écrans à plus haute résolution – est un processus semé (et/ou entrelacé) de défis. La capture des données et leur conversion demandent beaucoup de travail et chaque méthode laisse derrière elle des artefacts qui ont un impact sur l’apparence des nouvelles images. À mesure que les modèles d’apprentissage automatique éliminent le travail humain et le jugement de l’équation, ce danger augmente.

Même les transferts 4K professionnels peuvent apparaître à l’aérographe ou en plastique, une version inutilement yassifiée de quelque chose qui avait l’air parfaitement beau dans son format d’origine. (Si vous êtes arrivé jusqu’ici dans cet article, voici votre message d’intérêt public pour vous assurer que vous avez désactivé le lissage des mouvements sur votre téléviseur.) Comme Chris Person l’a noté dans The Aftermath à propos des pièges de la mise à l’échelle vidéo de l’IA, « Pourquoi transférer une cassette correctement alors que nous pouvons simplement laisser un ordinateur deviner mal à la place ? »

C’est essentiellement ce que fait le logiciel vidéo d’IA. Il devine où commence et se termine le visage d’une personne, comment ses mains bougent, comment la lumière et l’humidité réagissent sur sa peau. Il le fait très mal, mais le fait tellement de fois que (on espère) qu’il finira par se rapprocher suffisamment d’avoir globalement raison. Pour Reamsbottom, il s’agit de la meilleure solution pour publier des clips dans lesquels la vidéo source n’est pas disponible – et pour le genre de brefs moments de camp qui n’attirent pas nécessairement l’attention des maisons de restauration professionnelles.

Il a déclaré à IndieWire qu’il s’agissait d’essais et d’erreurs constants, équilibrant les différents modèles d’IA disponibles et ajustant la netteté et les ombres afin d’éviter les problèmes les plus susceptibles d’échouer les programmes de mise à l’échelle. Comme les dents.

« À mesure qu’il augmente les détails sur le visage, le modèle d’IA augmentera de manière excessive les détails sur les dents et vous pourrez voir des lignes sombres entre les dents individuelles », a déclaré Reamsbottom. « Alors je » Cela peut paraître un peu effrayant. Parfois, on dirait qu’ils ont tout d’un coup des dents très foncées parce que cela souligne tellement chaque dent.

Reamsbottom doit jouer avec la quantité de détails, en essayant toujours d’éviter, selon ses mots, de transformer le sujet de la vidéo en un personnage Pixar. Il doit également tenir compte des défis inhérents aux images elles-mêmes. « J’en ai fait une de Phyllis Diller récemment, qui était vraiment difficile à améliorer parce que sa tenue était à paillettes », a déclaré Reamsbottom. « Son visage était peut-être beau, mais tout d’un coup, les paillettes n’avaient plus l’air bien. Il faut vraiment beaucoup jouer.

« Jouer » ne suffit pas à saisir le temps que cela demande. Reamsbottom a déclaré que la réalisation d’un seul passage sur une vidéo de 30 minutes peut prendre plus d’une journée, même avec un ordinateur de mise à l’échelle dédié. Et l’apprentissage automatique ne peut pas rendre la pixellisation impeccable.

« Il faut avoir quelque chose au moins de qualité moyenne pour en faire quelque chose de vraiment sympa », a-t-il déclaré. « Même dans ce cas, cela peut être incertain, mais certains des éléments de très mauvaise qualité et très pixelisés avec lesquels j’ai essayé de travailler ? C’est dur. Les visages sont durs, les dents sont dures ou, vous savez, un nez peut disparaître.

Bien qu’il existe des fonctionnalités d’édition générative « IA » sur les nouveaux téléphones Samsung (et les modèles similaires à venir sur iPhone) qui semblent fonctionner beaucoup plus rapidement, être capable de bien représenter la réalité grâce à des modèles d’apprentissage en profondeur reste l’apanage des personnes qui travaillent professionnellement avec la vidéo. et ceux qui, comme Reamsbottom, peuvent consacrer beaucoup de temps et d’argent à cet effort.

La demande de temps peut encore être élevée, mais les outils pour y parvenir ne sont pas coûteux ; Reamsbottom utilise une suite logicielle de 300 $ de Topaz Labs. Et si c’est bien fait, les résultats peuvent être incroyablement gratifiants.

Reamsbottom a travaillé avec une archive de cassettes de Connie Francis, offertes par la famille d’un fan qui a enregistré une énorme quantité d’images de la chanteuse pop. « Il y a des images de lui et des images personnelles de Connie, et quand vous les voyez mises à l’échelle, cela vous rend presque ému parce que c’est comme si vous viviez quelque chose pour la première fois », a déclaré Reamsbottom. « C’est magique quand on obtient le résultat final, et ça semble super clair. C’est comme si tu y étais à nouveau.

Article précédent Ryan Gosling signe un premier accord avec Amazon MGM
Article suivant En quoi le spectacle sera-t-il différent du livre ?
Salut à tous les passionnés de séries TV ! Mon amour pour les histoires a toujours été au cœur de ma vie, et aujourd'hui, je suis ravie de partager cette passion avec vous sur notre plateforme dédiée aux séries TV et à l'actualité du monde du petit écran. En dehors de l'écran, je m'investis dans des projets visant à promouvoir la diversité et l'inclusion dans l'industrie du divertissement. Pour moi, l'art doit refléter la richesse de notre société. À la trentaine, je continue de m'épanouir dans l'écriture et l'exploration de nouveaux horizons narratifs. Mon objectif est de partager avec vous les dernières informations sur vos séries préférées !