-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathinfo kling3.txt
More file actions
46 lines (45 loc) · 15.6 KB
/
info kling3.txt
File metadata and controls
46 lines (45 loc) · 15.6 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
https://www.youtube.com/watch?v=jA4toox2GNM
Transcript:
Clim 30 vient de sortir et c'est vraiment une révolution pour la création vidéo. Regarde la qualité du modèle, nouveau modèle, un modèle unique. La gestion des scènes d'action, c'est incroyable. Il y a plus de ou de distorsion de personnag c'est fluide. Il y a le multiot qui est intégré. Ça veut dire que sur une même séquence et bien on va avoir plusieurs plans de caméra et on garde la consistance des scènes et des personnages. C'est génial.
On a aussi l'audio qui est maintenant traité avec le lips et de manière extraordinaire. Regarde, c'est qualité et on peut faire des scèes jusqu'à 15 secondes en choisissant exactement la durée de sa scène. Je te montre tout ça en détail dans Cling et on va voir au travers d'exemple vraiment la qualité du nouveau modèle.
On verra également comment faire du multishot. On va voir comment le contrôle temporel, c'est-à-dire le slider pour définir notre durée de vidéo va nous aider. On traitera l'audio, que ça soit les sons d'ambiance ou les voix, les dialogues des personnages et surtout on va regarder comment se travaille la cohérence au travers des éléments et ça c'est fondamental.
Et puis il y aura d'autres petits trucs que je te rajouterai en plus et qui sont super sympas dans Clling. Allez, on est parti. Quand j'arrive dans l'interface de Cling, je vais aller me mettre sur générer. Et donc sur cet écran à droite, ben j'ai tout ce que j'ai déjà créé et que je peux d'ailleurs retravailler. On le verra plus tard.
Et à gauche, j'ai mon panneau pour travailler. Donc je suis bien en vidéo 3.0. Ici, je peux lui ajouter une image si je le souhaite. J'ai juste à l'amener en dessous. Et bien, j'ai là où je vais pouvoir mettre mon prompt. À noter que je peux mettre une image de fin également. Les éléments, on verra ça plus tard. Et ici, je vois que j'ai le mode multihot qui est activé et j'ai un autre mode qui est custom multiot.
Donc custom multiot et bien c'est un mode sur dans lequel je vais pouvoir définir toutes mes séquences à l'intérieur de ma scène. Là j'en ai une, elle fait 7 secondes parce que ma durée totale c'est 7 secondes mais je peux en rajouter une deuxè une trè jusqu'à 6. Allez je vais revenir sur le mode normal en repliquant dessus. Ici j'ai la définition 720 ou 1080.
Je me mets toujours en 1080. Ici, j'ai la durée, donc je peux aller de 3 secondes à 15 secondes. 3 à 5 secondes peut être très bien pour faire des transitions, des morphings, des choses comme ça. Et des scènes de narration ou de de mise dans l'atmosphère. Bien, on ira jusqu'à du 15 secondes.
Je définis le nombre de sorties que je veux. Alors moi je me mets toujours à 1. Ici j'ai native audio bien évidemment ça va affecter le nombre de crédits que je vais utiliser. Donc on va commencer très très simple et je vais lui dire de me générer un trailer pour Blade Runner. Voilà rien à faire de plus. Il va il est en multiot donc il va me créer un trailer de 10 secondes.
Je laisse l'audio et je déclenche. [musique] Impressionnant comme résultat hein. C'est vraiment super beau. Réalisme, changement de plan. Vraiment c'est super bien fait. Allez maintenant on va aller un cran plus loin dans le multishut. J'ai importé une image et là je me mets en mode custom multiot. Comme j'ai une vidéo de 10 secondes, il m'a fait deux shots de 5 secondes.
Donc ce que je vais faire, c'est que je vais lui mettre un texte pour le premier promptte. On va faire du très très simple. La femme embrasse l'homme passionnément. Pour le deuxième et bien la femme le repousse violemment. Et je vais créer une troisième séquence. Donc je fais shot en plus et je vais inclure du son puisque je vais lui dire que la femme lui crie dessus et lui dit "Je veux plus jamais te revoir.
" On va ajuster peut-être les durées. Quand on met du des voix, des dialogues, il faut toujours faire super gaffe que ce que l'on dit bah ça tient bien dans la durée qu'on a programmé. Donc pour ça, je t'encourage à tester toi-même et voir si c'est compatible. Sinon, il y aura un problème à la restitution. Pour aller un peu plus loin, on va se faire aider par Gini en créant un gemme ou un GPT sur chat GPT où on va donner la durée de la scène, le nombre de shots que l'on veut.
l'idée générale de la scène et dire si on veut des dialogues ou pas. Et à partir de là, il va nous créer automatiquement pour chaque shot une séquence avec les mouvements de caractère, le lighting, le mouvement de caméra et les dialogues. Et comme ça, je n'ai plus qu'à faire du copiercollé à l'intérieur de Clling. Je lui donne toujours ma photo.
Et maintenant, j'ai mes shots en anglais. Cet exemple est super intéressant. Bon, on voit qu'au départ, il a essayé de raccorder l'image que je lui ai donné avec le scénario, mais là, c'était compliqué. C'est moi qui ne lui ai pas donné en fait la bonne image de départ. Mais après ça, sur les scènes, c'est vraiment incroyable ce qu'il a fait.
Il a repris exactement les mêmes personnages. Les trait, c'est les mêmes. Et les expressions, le mouvement de caméra, on voit que quand elle est stressée, ça la caméra bouge. Quand elle se lève, il y a sa veste qui bouge également. L'expression de colère, elle est géniale. L'expression d'embarras du mec, elle est super.
Vraiment, c'est un boulot qui est extra. Pour vraiment me rendre compte, j'ai fait un test en comparant Kling avec Grock. Je suis parti de la même image et j'ai rentré le même prom. This is over, Leo. I couldn't wait anymore. Même si je trouve la performance de Grock assez bluffante, clairement Cling est au-dessus.
les visages, les pors, les détails de la peau sont bien mieux faits, les expressions des personnages également beaucoup plus crédible, moins surjoué, plus réaliste et quand on regarde les deux scènes, il y en a une qui est beaucoup plus crédible que l'autre finalement. Dernier exemple avant qu'on passe à la partie méga intéressante sur les éléments.
J'ai repris mon scénario fait par Gémini scène par scène là les quatre shots. Et ce couplà, je lui ai mis une image beaucoup plus appropriée à la première scène. C'est vraiment trop bon. Je m'en lasse pas. Alors, tu peux te demander pourquoi tous mes personnages parlent que en anglais ? Très bien parce qu'aujourd'hui c'est une des limitations qu'il y a, c'est que dans les langages qui sont permis et bien il y a l'anglais, le chinois et puis en européen il y a l'espagnol.
Donc on peut penser que le français va arriver mais pour l'instant c'est pas le cas. Donc j'ai essayé de faire de du français pour prononce les vidéos. Les résultats sont pas forcément concluants, alors je préfère rester en anglais. Et maintenant, on va passer aux éléments. Les éléments, je vais les trouver dans les assets, soit ici, soit ici.
Dans les assettes, et bien, j'ai tout ce qui me concerne, donc tout ce que j'ai fait. Et là, il y a principal à 7 et je vais trouver mes éléments. Alors, dans mes éléments, je vais essentiellement avoir des personnages et ces personnage c'est une vue de face en général et ensuite des vues de profil de 3/4 de dessus de dessous et cetera.
Et ça c'est ce qui va ensuite guider Kling pour assurer la cohérence des personnages. Avant de faire cela, le mieux c'est de se créer une planche d'image pour avoir son personnage sur tous les profils. Donc là, j'ai mon image et j'ai un prompt spécial pour créer ça que je vais rentrer dans LM Arena qui s'appelle maintenant Arena et qui va créer ma planche.
Alors, j'ai fait un tuto là-dessus qui s'appelle 100 % consistance et je te laisserai le lien dans la vidéo si tu veux voir tous les détails et accéder à ce prompt. Soit tu le prends en capture d'image ici et tu l'extrais par G chat GPT, soit tu le trouveras directement dans ma vidéo. Voilà, j'ai ma planche d'image. Impeccable.
Je peux la charger et retourner dans cling. Dans cling, je fais générer. Là, je peux importer une image soit de mon historique, soit de mon disque dur. Je vais lui apporter la planche. Je vais lui donner un nom. C'est un caractère. Oui. Et ici, je peux lui donner une description ou lui faire générer automatiquement la description.
Et donc maintenant générer. J'ai mon élément et maintenant je peux en disposer dans mes vidéos. J'ai chargé mon image de départ. Ici je vais charger mes trois éléments. Donc il y a Elanor, Fasa et Sirena. Et là je vais donner mon prompt. Je suis en mode multiot. Je vais mettre 10 secondes. Maintenant, un autre mode que j'aime bien parce que je n'ai pas besoin de lui donner une image de début.
Je vais aller sur Omni et ici je vais pouvoir directement lui rentrer mes éléments. Donc je vais choisir mes personnages à partir de mes éléments. Donc je clique sur all ici et là j'accède à mes éléments et je vais choisir Hydra et puis top fremen. Voilà donc ils sont apparus ici. Et maintenant je vais donner mon scénario.
Bon, je vais me mettre à 15 secondes. Je vais sélectionner native audio parce que j'ai des dialogues et donc je vais adapter mon prom cinématique sin alien steel lighting the woman. Donc là je vais dire que la woman c'est hydrabas et je choisis hydrazan. C'est l'autre arobasen. Ça, je vais pouvoir l'effacer playing chest.
Donc il joue aux échecs dans un vaisseau spatial qui transporte des aliens. Donc je dis ce que je veux comme type de plan de caméra et je lui donne les dialogues et on va voir ce qu'il va être capable de nous générer. En attendant un petit truc, tu vois que tous mes promptes ils sont en anglais. Alors je te conseille vraiment de faire pareil et pour ça c'est pas compliqué.
Soit tu vas sur chat GBD Gemini ou Deep L et tu lui demandes de traduire ce que tu écris en français en anglais. Et c'est comme ça que j'ai fait cette scène avec les filles dans Paris qui vont au McDo. Alors, tu reconnaîtras que il y a des scènes qui ne se sont pas passées hyper bien. Donc ça veut dire que ben il y a un certain nombre de fois où il faut reprendre pour avoir le rendu visuel que l'on veut.
Mais globalement quand tu regardes sep scènes pour en retenir quatre, ça me semble correct. [musique] [musique] [musique] [musique] Maintenant, regardons les limitations. Si on met trop trop de personnages de d'éléments et bien il se perd un peu. Là on voit que sur le début de la scène, il commence avec les cinq personnages que je lui ai chargé, les cinq éléments et là il ajoute un 6e élément.
Donc ça c'est pas bon. De retour dans le mode omni, j'ai sélectionné mes éléments. Donc Elanor, Elanor, FA et Sirena. Et puis j'ai sélectionné aussi un décor que j'ai monté en élément. Là, j'ai créé quatre shots avec une description pour chacun d'eux. Alors, je me suis fait aider par Gémini pour faire ça d'une scène champêtre où les trois fait s'amusent dans le décor.
On voit que là, il a eu du mal en custom multiot. Il a pas mis le nombre de personnages comme il faut. [rires] Ça c'est plutôt pas mal. Bon là, il une erreur et la fin est plutôt très sympa. Pour finir, je reprends le concept mais en mode multihot simple, donc toujours avec mes personnages et mon décor et je lui donne le type de scène.
Et là, je vois que le résultat est vraiment beaucoup mieux. Tout est consistant, les scènes sont propres et il y a du vrai multiot. De mes expériences, je retiens essentiellement deux choses. Le mode multihot simple et très très efficace. Le deuxième, c'est que le custom multiot, à moins d'être vraiment un expert de prompting vidéo, l'utiliser avec des prompts simples et souvent plus efficaces.
Avant de conclure, voyons quelques autres fonctionnalités que l'on trouve dans Cling. Le mode avatar permet soit d'aller charger un avatar depuis une librairie ou d'importer notre propre image ou de faire créer une image par LIA. Ensuite, on peut soit mettre un texte, soit importer son audio. On peut choisir les voix.
Donc il y a une bibliothèque de voix qu'on peut tester et hop, on sélectionne. On vient choisir l'émotion de la voix, le speech rate si on peut le changer. Et puis on peut ajouter un prompt, c'est optionnel pour dire ce qui va se passer. Bien évidemment, je peux sélectionner la qualité et le nombre de rendus. Il y a un mode motion control où je peux lui entrer une image.
Je peux sélectionner une vidéo avec des mouvements. Donc soit dans la bibliothèque fournie ou alors si moi j'ai enregistré mes propres mouvements. Là je suis allé chercher sur YouTube l'image d'un danseur et je peux l'importer et ensuite m'en servir. Donc si je sélectionne par exemple celui-ci, je peux maintenant décider si je vais faire matcher ma vidéo finale sur l'orientation du caractère ici ou sur celui de mon image.
Optionnellement, j'ai je peux mettre un prompt et mettre de l'audio. Définir la qualité et c'est parti. Il y a un mode image dans lequel je peux soit lui mettre une image de référence, soit faire du texte to image simple. J'ai un certain nombre de styles que je peux utiliser. Donc sélectionner et puis en terme de format, je peux faire du 1K, du 2K.
J'ai plein de d'aspects ratio différents et je peux sélectionner le nombre d'output que je veux. Autre chose que je voulais te montrer, quand tu es sur tes vidéos, tu sélectionnes une vidéo, et bien là, tu peux faire par exemple extract frame, c'est-à-dire que tu vas enregistrer n'importe quelle image, tu peux faire un extract frame et il va te la downloader.
Tu peux faire aussi du lipsc. Donc là, tu passes en mode lipsync, tu peux lui définir le texte, tu peux choisir la voix, je peux faire add speech, je peux positionner mon speech et je fais générer. On a vu beaucoup de choses dans ce tuto sur Cling 3.0, ce qu'il faut retenir. 1, la qualité du nouveau modèle 3.
0 Zé qui est fantastique de réalisme et de gestion des images animées. De l'utilisation du mode multihot avec les éléments que tu vas créer. C'est hyper puissant. 3 l'extension de la durée possible jusqu'à 15 secondes. Et 4, la synchro laabiale qui est vraiment juste extra. quel que soit l'angle de vue du personnage.
Alors, si j'ai à donner un verdict, les points fort, c'est le rendu. C'est vraiment le meilleur rendu du marché actuel. Des vraies scènes cinématographiques, c'est plus juste des clips, une cohérence globale qui est extra. Les limites, ben ça remplace pas encore un tournage professionnel. Le lifting français est pour le moment absent, il va sûrement arriver et parfois faut quand même faire plusieurs essais pour avoir le rendu que l'on souhaite.
Cling 3.0 est en mode démarrage et donc n'est pas gratuit. Voilà ce qu'il faut retenir. Cling 3.0 est aujourd'hui en early access qui veut dire qu'à l'heure où je fais la vidéo, il n'est disponible que sur les plans pro premier et ultra. Donc le moins cher, c'est le pro à 26 le premier mois, mais ensuite attention c'est 32, ce qui nous fait en annuel 293 dollars, c'est dire 250 à peu près euros euh pour avoir la meilleure réduction, c'est quand même cher.
Mais avec ça, on a le modèle 3.0, on a 3000 crédits par mois. Et donc pour tester euh chacun juge mais moi j'utilise Cling depuis plus d'un an et c'est vraiment le modèle que j'utilise quand je veux faire de la qualité. À noter que on peut s'abonner à Cling directement mais que Cling est aussi disponible sur d'autres plateformes comme Xfield.
Si tu t'abonnes avec le lien que je vais te laisser dans la description, tu pourras obtenir 50 % de crédit supplémentaire. lors de ton abonnement. Alors attention, ça ne marche pas sur un 7 jours d'essai gratuit. Il faut un abonnement mensuel ou annuel. Si tu as aimé cette vidéo, mets-moi un j'aime, abonne-toi à ma chaîne et vraiment je te conseille au moins d'essayer pour te rendre compte par toi-même.
Merci, fais-moi part de tes commentaires et à bientôt.