IA Image-to-Image : Comment ça marche et comment l'utiliser (avec exemples)
Un designer avec qui je travaille m'a montré quelque chose le mois dernier qui m'a coupé la parole en plein milieu d'une phrase. Elle a pris un croquis grossier au crayon d'un agencement de salon — le genre qu'on griffonne sur une serviette en trente secondes — l'a téléchargé dans un outil d'IA et a tapé : « Rendu intérieur photoréaliste, lumière chaude d'après-midi, mobilier mid-century modern, parquet en bois. » Quinze secondes plus tard, le croquis était une photo entièrement rendue d'une pièce qui n'existait pas.
« Ça m'a pris trois jours l'année dernière », a-t-elle dit. « J'ai dû le modéliser dans SketchUp, exporter vers un moteur de rendu, attendre six heures pour le rendu, puis corriger l'éclairage dans Photoshop. »
Lovart is the AI design agent trusted by 10M+ creators. Try Lovart Free →
Related: Scaling Your Design Agency with AI: From 5 to 50 Clients Wit | Lovart Digest — Best Design Tips, Tools & Templates This Wee
C'est ça l'IA image-to-image. Ce n'est pas la même chose que générer une image à partir d'un prompt textuel. Ce n'est pas un filtre. C'est une capacité entièrement différente — et l'une des choses les plus utilement pratiques que les outils de design IA peuvent faire.
Si vous avez entendu le terme mais ne savez pas comment ça marche, à quoi ça sert ni comment l'utiliser concrètement, ce guide couvre tout.
Ce qu'est vraiment l'IA image-to-image
L'image-to-image (souvent abrégé en img2img) est un processus IA qui prend une image existante comme entrée et génère une nouvelle image basée à la fois sur la structure visuelle de l'entrée et sur une description textuelle du résultat souhaité.
Pensez-y comme à un traducteur entre formats visuels. Vous fournissez un plan structurel — un croquis, une photo, une composition approximative — et décrivez le format de destination. L'IA préserve la disposition et le contenu fondamentaux de votre entrée tout en transformant le style visuel, le médium ou le niveau de détail.
Voici ce qui le distingue des concepts connexes :
L'image-to-image n'est pas du text-to-image. Le text-to-image part de rien d'autre que des mots. L'image-to-image part d'une image. L'image d'entrée fournit un guidage spatial — où se trouvent les objets, quelles formes existent, comment la composition est agencée — qu'un prompt textuel seul ne peut pas communiquer efficacement.
L'image-to-image n'est pas un filtre. Un filtre applique un effet visuel uniforme sur une image existante. L'image-to-image re-rend fondamentalement le contenu. Un croquis de chien passé dans img2img avec le prompt « golden retriever, photoréaliste, assis dans un parc ensoleillé » produit un golden retriever photographique dans un parc — pas un croquis avec un filtre photo superposé.
L'image-to-image n'est pas de l'inpainting ni de l'outpainting. L'inpainting modifie une région spécifique d'une image. L'outpainting étend une image au-delà de ses bordures d'origine. L'image-to-image transforme l'image entière tout en préservant son cadre structurel. Des outils différents, des cas d'usage différents.
Comment fonctionne réellement l'image-to-image (la version simple)
Comprendre grosso modo ce qui se passe sous le capot vous aide à écrire de meilleurs prompts et à obtenir de meilleurs résultats. Voici la version simplifiée.
Les modèles d'images IA sont entraînés sur des millions d'images. Pendant l'entraînement, le modèle apprend à associer des motifs visuels — formes, textures, couleurs, compositions — aux mots qui les décrivent. Quand vous utilisez le text-to-image, le modèle part d'un bruit aléatoire et le façonne progressivement en une image qui correspond à votre description.
L'image-to-image fonctionne différemment. Au lieu de partir d'un bruit aléatoire, il part de votre image d'entrée — mais avec une nuance cruciale. Le modèle ajoute d'abord une quantité contrôlée de bruit à votre image d'entrée, l'obscurcissant partiellement. Ensuite, il exécute le même processus de débruitage que le text-to-image, guidé par votre prompt textuel. Plus on ajoute de bruit, plus l'IA a de liberté pour changer les choses. Moins il y a de bruit, plus le résultat reste proche de l'entrée.
Cela est contrôlé par un paramètre généralement appelé « strength » ou « denoising strength » — une valeur de 0 à 1. Une force de 0 restitue votre image d'entrée inchangée. Une force de 0,3 préserve la majeure partie de la structure mais change le style. Une force de 0,7 ne conserve que la composition approximative et réinterprète tout le reste. Une force de 1 est essentiellement du text-to-image (l'entrée est complètement obscurcie).
La plupart des outils de design IA gèrent ce paramètre automatiquement selon ce que vous essayez de faire — vous n'avez pas besoin de penser à la force de débruitage en termes de chiffres. Mais comprendre le concept aide quand le résultat est soit trop proche de l'entrée (« essayez une force plus élevée » dans votre tête), soit trop différent (« essayez une force plus basse »).
Cinq exemples pratiques d'image-to-image
La meilleure façon de comprendre l'image-to-image est de le voir en action. Voici cinq cas d'usage réels, avec les prompts que vous utiliseriez réellement.
1. Croquis vers rendu photoréaliste
Entrée : Un croquis approximatif d'un produit — disons, une tasse en céramique avec une forme d'anse et des proportions spécifiques. Le croquis établit la forme, l'angle, la composition. Mais il ressemble à un croquis.
Prompt : « Tasse en céramique artisanale, glaçure mate vert forêt profond, posée sur une table en bois de récupération, lumière du matin venant d'une fenêtre proche, faible profondeur de champ, style photographie de produit. »
Résultat : Une photo de produit photoréaliste d'une tasse en céramique verte. L'IA a préservé la forme et l'angle de la tasse de votre croquis mais a rendu chaque surface avec un détail photographique — la texture de la glaçure, le grain du bois, la décroissance douce de la lumière de la fenêtre. Un photographe de produit aurait besoin d'un studio, d'équipement d'éclairage et d'une tasse physique pour produire cela. Vous avez eu besoin d'un croquis et de quinze secondes.
C'est l'application la plus immédiatement utile de l'image-to-image pour quiconque conçoit des produits physiques — meubles, emballages, céramique, vêtements, accessoires. Vous pouvez itérer sur la forme et les proportions dans un croquis et voir des résultats photoréalistes en secondes, pas en jours.
2. Photo vers illustration ou peinture
Entrée : Une photographie — un paysage d'un voyage récent, un portrait d'un membre de la famille, une photo d'une devanture de magasin.
Prompt : « Aquarelle, coups de pinceau libres et expressifs, palette légèrement atténuée, texture du papier visible, interprétation artistique, style illustration éditoriale. »
Résultat : Une aquarelle qui suit la composition de votre photo mais la rend dans un médium entièrement différent. La montagne est toujours là où était la montagne. La personne est toujours cadrée de la même façon. Mais chaque surface est un coup de pinceau au lieu d'un pixel, du pigment au lieu de la lumière.
C'est utile pour : créer des œuvres d'art personnalisées à partir de photos personnelles, générer des illustrations éditoriales pour des articles, produire de la variété visuelle dans le contenu d'une marque (photos pour les pages produits, versions peintes pour les pages à propos), et explorer à quoi ressemblerait une scène dans différents styles artistiques avant de commander un véritable artiste.
3. Mood board vers scène cohérente
Entrée : Un collage approximatif ou un mood board — des images assemblées montrant l'ambiance, la palette de couleurs et les éléments que vous souhaitez dans l'image finale.
Prompt : « Coin lecture cosy, bibliothèques du sol au plafond, fauteuil surdimensionné en velours couleur rouille, lampadaire à lumière chaude ambrée, tapis persan, lumière d'après-midi à travers des rideaux transparents, habité et accueillant, photographie de design d'intérieur. »
Résultat : Une scène d'intérieur entièrement réalisée qui synthétise les éléments de votre mood board en une seule image cohérente. L'IA ne se contente pas de copier-coller vos références — elle comprend que « fauteuil en velours rouille » appartient à côté de « bibliothèques du sol au plafond » et les compose en une pièce crédible.
Les designers d'intérieur, les décorateurs de plateau et toute personne planifiant un projet visuel peuvent utiliser cela pour passer d'une inspiration éparpillée à une vision unifiée en une seule étape.
4. Basse résolution vers haute résolution avec récupération de détails
Entrée : Une vieille photo en basse résolution — une photo de famille scannée d'un tirage, une image compressée tirée d'un vieux site web, une photo de smartphone prise en mauvais éclairage.
Prompt : « Haute résolution, détaillée, restaurée, tons de peau naturels, mise au point nette et propre, améliorée mais pas artificielle. »
Résultat : Pas seulement une version plus grande de la même image floue. L'IA remplit des détails plausibles — texture de la peau, tissage du tissu, éléments d'arrière-plan — en se basant sur sa compréhension du fonctionnement des photographies. Elle ne récupère pas le détail original (cette information est perdue). Elle génère de nouveaux détails cohérents avec ce que l'image montre.
Ce n'est pas du « zoomer et améliorer » à la CSI — l'IA ne sait pas à quoi ressemblait réellement le visage de votre grand-mère à cette résolution. Mais elle peut produire un résultat qui semble naturel, de haute qualité et fidèle à l'esprit de l'original. C'est une restauration par génération, pas par récupération.
5. Transfert de style sur toute une série
Entrée : Un ensemble de photos de produits — dix articles différents, tous pris sur des fonds différents avec un éclairage incohérent.
Prompt : « Style de photographie de produit cohérent, fond blanc propre, éclairage de studio doux et uniforme, légère ombre portée, photo de produit e-commerce, qualité catalogue professionnelle. »
Résultat : Dix images de produits qui semblent provenir du même shooting photo. Même éclairage. Même fond. Même qualité visuelle. Une petite marque e-commerce qui a photographié des produits sur six mois avec différents téléphones dans différentes pièces peut toutes les passer dans img2img et obtenir un catalogue qui paraît professionnellement produit.
C'est le cas d'usage qui fait gagner le plus de temps au plus de monde : les petites entreprises qui ont des photos de produits existantes mais ne peuvent pas s'offrir un nouveau shooting studio cohérent.
Comment utiliser l'image-to-image : un workflow étape par étape
Si vous n'avez jamais utilisé l'image-to-image, voici le workflow qui produit des résultats cohérents.
Étape 1 : Commencez avec une image d'entrée claire. La qualité de votre entrée compte. Un croquis avec des lignes nettes et des formes définies donne à l'IA plus d'informations structurelles avec lesquelles travailler qu'un gribouillis vague. Une photo avec un bon éclairage et une séparation nette du sujet produit de meilleures transformations qu'une image sombre et encombrée. L'IA travaille avec ce que vous lui donnez — garbage in, garbage out s'applique ici autant qu'ailleurs.
Étape 2 : Rédigez un prompt qui décrit le résultat, pas l'entrée. C'est l'erreur de débutant la plus courante. Si votre entrée est un croquis de chaise, n'écrivez pas « un croquis de chaise ». Écrivez ce que vous voulez que le résultat soit : « Fauteuil mid-century modern, cadre en noyer, revêtement en laine charbon, contre un mur blanc, lumière naturelle venant de la gauche, style photographie d'architecture. »
Étape 3 : Soyez précis sur la transformation souhaitée. « Améliorez ça » ne fonctionnera pas. « Transformez ce croquis en rendu produit photoréaliste, éclairage de studio, détail 8K » fonctionnera. L'IA a besoin de savoir quel type de transformation vous demandez — croquis vers photo, photo vers peinture, basse résolution vers haute résolution, incohérent vers cohérent.
Étape 4 : Utilisez des références de style. Si vous voulez un look spécifique, nommez-le. « Dans le style d'un dessin du New Yorker. » « Comme un Polaroid des années 1970. » « Photographie de mode éditoriale, style Vogue. » L'IA a vu ces références dans ses données d'entraînement et peut les approximer. C'est bien plus efficace que d'essayer de décrire un style visuel à partir de zéro.
Étape 5 : Itérez sur le résultat. Votre premier résultat sera rarement parfait. Si la transformation est trop agressive (le résultat ressemble à peine à l'entrée), utilisez une force plus faible ou décrivez l'entrée plus soigneusement. Si elle n'est pas assez agressive (le résultat ressemble trop à l'entrée), augmentez la force ou rendez la description de la transformation plus explicite. C'est un cadran, pas un interrupteur — et apprendre où régler le cadran pour différents types de transformations est la principale compétence que vous développerez avec la pratique.
Étape 6 : Retouchez des éléments spécifiques. La plupart des outils de design IA avec image-to-image prennent également en charge l'édition ciblée — cliquer sur une région spécifique et décrire ce qu'il faut changer. « Rendez ce bois de chaise plus foncé. » « Supprimez cet objet de l'arrière-plan. » « Ajoutez une plante sur le côté gauche du cadre. » Utilisez img2img pour la transformation large, puis l'édition ciblée pour les ajustements de précision.
Erreurs courantes et comment les corriger
Après avoir aidé des dizaines de personnes à travers leurs premières tentatives d'image-to-image, j'ai vu les mêmes problèmes revenir sans cesse. Voici ce qui ne va pas et comment y remédier.
Erreur : Le résultat ne ressemble pas du tout à l'entrée. Votre force est réglée trop haut, ou votre prompt contredit l'image d'entrée. Si votre entrée est une photo d'un chien et que votre prompt dit « un chat », l'IA va suivre le prompt. Réduisez la force ou assurez-vous que votre prompt décrit le résultat d'une manière compatible avec l'entrée.
Erreur : Le résultat ressemble exactement à l'entrée. Votre force est trop basse. L'IA a à peine modifié quoi que ce soit. Augmentez la force ou rendez votre description de transformation plus dramatique. « Amélioration subtile » à faible force produit des changements presque imperceptibles.
Erreur : Le résultat présente des artefacts étranges ou des distorsions. Cela arrive quand l'image d'entrée a des éléments confus — formes qui se chevauchent, bords ambigus, faible contraste entre le sujet et l'arrière-plan. Nettoyez d'abord l'entrée : recadrez sur le sujet, augmentez le contraste, simplifiez la composition. Plus les informations structurelles de votre entrée sont claires, plus le résultat est propre.
Erreur : Le transfert de style ne correspond pas. Les descriptions de style génériques produisent des résultats génériques. « Style peinture » donne trop d'options à l'IA. « Peinture à l'huile, technique impasto, coups de pinceau visibles, éclairage Rembrandt, fond sombre, tons chauds » donne à l'IA une cible spécifique. La spécificité est primordiale dans les prompts image-to-image.
Erreur : Les couleurs du résultat sont mauvaises. Ajoutez une direction de couleur à votre prompt. Ne décrivez pas seulement le sujet et le style — décrivez la palette. « Tons terre atténués, vert sauge et terre cuite chaude. » « Bleus et gris froids, clinique et propre. » L'IA tendra vers votre palette décrite.
FAQ
Q : Quelle est la différence entre l'image-to-image et le simple fait d'utiliser un filtre ?
Un filtre applique un effet uniforme sur toute l'image. L'image-to-image re-rend fondamentalement le contenu selon la compréhension par l'IA de ce que l'image contient et de ce que vous demandez. Une transformation croquis-vers-photo avec img2img génère des détails photographiques — textures, éclairage, ombres — qu'un filtre ne peut physiquement pas produire car les filtres ne comprennent pas qu'un cercle dans un croquis représente une tasse, pas juste un cercle.
Q : Puis-je utiliser l'image-to-image pour upscaler de vieilles photos ?
Oui, et c'est l'un des meilleurs cas d'usage. Les photos en basse résolution, les tirages scannés, les images numériques compressées — img2img avec un prompt comme « haute résolution, détails améliorés, photographie restaurée » peut produire des résultats naturels et détaillés. L'IA génère des détails plausibles basés sur sa compréhension de la photographie, des visages et des environnements. Elle ne récupère pas des informations perdues — elle génère de nouvelles informations cohérentes.
Q : En quoi l'image-to-image diffère-t-il du Touch Edit ?
L'image-to-image transforme l'image entière. Le Touch Edit (ou l'édition ciblée) modifie un élément ou une région spécifique sans toucher au reste. Ils sont complémentaires : utilisez img2img pour les transformations larges, puis Touch Edit pour les ajustements chirurgicaux.
Q : Quels formats de fichier fonctionnent le mieux comme entrée ?
PNG et JPG sont universels. Les entrées en plus haute résolution produisent généralement de meilleurs résultats car l'IA dispose de plus d'informations structurelles. Un croquis de 512px produit moins de détails dans le résultat qu'un croquis de 2048px. Les fichiers vectoriels (SVG, EPS) doivent généralement être rastérisés d'abord.
Q : L'image-to-image peut-il gérer plusieurs sujets dans une image ?
Oui, mais les résultats dépendent de la clarté avec laquelle chaque sujet est défini. Une image avec un sujet clair au premier plan et un arrière-plan simple fonctionne mieux qu'une image encombrée avec cinq sujets qui se chevauchent. Si votre entrée est complexe, décrivez le sujet le plus important dans votre prompt — l'IA concentrera son effort de transformation dessus.
Q : Y a-t-il des préoccupations de droits d'auteur avec l'image-to-image ?
Si vous avez créé l'image d'entrée ou avez les droits de l'utiliser, le résultat est généralement considéré comme une œuvre dérivée qui vous appartient — comme si vous commandiez à un artiste une version peinte de votre photographie. Si l'image d'entrée n'est pas la vôtre, les mêmes préoccupations de droits d'auteur s'appliquent qu'avec toute utilisation d'image. Vérifiez les conditions de votre outil IA pour les politiques spécifiques sur la propriété des résultats.
Q : Combien de temps prend la génération image-to-image ?
Généralement 5 à 30 secondes, selon la résolution et la complexité. C'est plus rapide que le text-to-image dans la plupart des cas car l'IA commence avec des informations structurelles plutôt que de construire à partir de zéro.
Q : Puis-je utiliser l'image-to-image pour des trames vidéo ?
Oui, mais le img2img image par image ne produira pas de résultats temporellement cohérents — chaque image est traitée indépendamment, donc le résultat peut scintiller ou changer d'une image à l'autre. Pour la vidéo, des outils vidéo-vers-vidéo dédiés produisent de meilleurs résultats. L'image-to-image est idéal pour les images fixes.
Une chose que vous pouvez essayer aujourd'hui
Trouvez le croquis le plus grossier sur votre bureau — un gribouillis de serviette, un diagramme de tableau blanc, un wireframe rapide que vous avez dessiné pendant une réunion. Ouvrez le ChatCanvas de Lovart, téléchargez-le et décrivez à quoi ce croquis devrait ressembler s'il était réel. Pas « rendez-le meilleur » — décrivez la chose finie réelle. Produit photoréaliste. Illustration finie. Intérieur soigné. Bâtiment rendu. Quelle que soit la chose que le croquis essayait de communiquer.
Lancez-le. Regardez le résultat. Si c'est proche, affinez — ajustez le prompt, peaufinez la description. Si c'est à côté, décrivez ce qui ne va pas et relancez. La transformation qui vient de se produire prenait autrefois des jours de travail qualifié. Maintenant, elle prend des secondes. La compétence n'est pas d'apprendre un logiciel complexe. Elle est d'apprendre à décrire ce que vous voyez dans votre tête suffisamment bien pour que l'IA puisse le voir aussi.



