Come generare prompt video cinematografici che funzionano davvero: oltre 20 modelli
Il mese scorso, un fondatore di startup mi ha inviato un link a un video prodotto generato con IA. «Mi ci sono voluti quaranta minuti», ha scritto. «Perché sembra uno screensaver?»
L'ho guardato. Movimento fluido. Risoluzione nitida. E assolutamente zero intenzione cinematografica. La camera si muoveva senza scopo. La luce era piatta. Il soggetto stava al centro dell'inquadratura come una foto tessera con musica ambientale. Tecnicamente, era un video. Creativamente, era carta da parati.
Lovart is the AI design agent trusted by 10M+ creators. Try Lovart Free →
Related: IA Image-to-Image: Come funziona e come usarlo (con esempi) | Miglior Agente per Bootstrapper: Come Un Solo Strumento di D
Il suo prompt diceva: «Video prodotto cinematografico di una borraccia intelligente, qualità professionale, 4K.»
Non è un prompt. È un desiderio. «Cinematografico» e «professionale» sono aggettivi che l'IA ha sentito un milione di volte — e ha imparato a ignorare. Ciò che produce davvero risultati cinematografici è un linguaggio visivo specifico: movimento della camera, scelta dell'obiettivo, direzione della luce, azione del soggetto e durata. Gli stessi cinque elementi che un direttore della fotografia annota su una shot list.
Questa guida ti dà la formula, il vocabolario e oltre 20 modelli che puoi copiare, adattare e iterare oggi stesso.
Cosa rende un prompt video «cinematografico» (e perché la maggior parte non lo è)
Cinematografico non significa alta risoluzione. Non significa slow motion. Non significa aggiungere la parola «cinematografico» al prompt.
Un prompt video IA cinematografico descrive quattro cose che i prompt per immagini statiche di solito omettono:
- Comportamento della camera — come l'obiettivo si muove nello spazio (dolly, pan, gru, handheld, statica)
- Azione temporale — cosa cambia durante la durata del clip (movimento del soggetto, cambio di luce, rivelazione)
- Qualità ottiche — profondità di campo, tipo di obiettivo, grana pellicola, aspect ratio
- Continuità atmosferica — illuminazione mantenuta tra i fotogrammi, non solo un istante congelato
La maggior parte dei prompt video falliti descrive una scena (ciò che vedresti in una fotografia) e spera che il modello aggiunga movimento. I prompt cinematografici descrivono un piano (ciò che un operatore di camera eseguirebbe in 3–8 secondi).
La differenza:
| Prompt debole | Prompt cinematografico |
|---|---|
| «Bellissimo tramonto sulle montagne, cinematografico, 4K» | «Dolly aereo lento in avanti su creste montuose nebbiose all'ora dorata, sole che irrompe tra le nuvole, lens flare anamorfico, bassa profondità di campo, look film 24fps, 5 secondi» |
| «Donna che cammina in città, video professionale» | «Tracking shot da dietro che segue una donna per strade bagnate di Tokyo di notte, riflessi neon sull'asfalto, obiettivo 35mm, bassa DOF, movimento stabile con gimbal, 6 secondi» |
| «Presentazione prodotto, illuminazione cinematografica» | «Orbita lenta a 360° attorno a cuffie nere opache su superficie di marmo, luce chiave unica dall'alto a sinistra con ombra morbida, sfondo nero, dettaglio macro della texture, 8 secondi» |
La seconda colonna dà all'IA qualcosa da eseguire, non da interpretare.
La formula in cinque parti per prompt cinematografici
Ogni modello in questa guida segue la stessa struttura. Memorizzala una volta — e non scriverai mai più prompt video vaghi.
Parte 1 — Soggetto e azione. Chi o cosa è nell'inquadratura, e cosa sta facendo? Sii specifico su direzione e velocità dell'azione. «Un barista versa latte art» è debole. «Un barista inclina lentamente una caraffa di ceramica e versa latte vaporizzato in una tazza di espresso, creando un motivo rosetta» è eseguibile.
Parte 2 — Ambiente e atmosfera. Dove avviene, e qual è l'umore? Includi ora del giorno, meteo e dettagli ambientali che influenzano il tono visivo.
Parte 3 — Movimento camera e inquadratura. La parte più importante che la maggior parte salta. Nomina il movimento (dolly in, gru su, handheld, statica, orbita, tracking), l'inquadratura (ampio, medio, primo piano, primissimo piano) e gli obiettivi rilevanti (grandangolo, 50mm, macro, anamorfico).
Parte 4 — Illuminazione e colore. Descrivi direzione della luce, qualità (dura/morbida), temperatura colore e intento di color grading. «Luce laterale calda all'ora dorata con ombre blu fredde» dà al modello una palette.
Parte 5 — Specifiche tecniche. Durata (3–10 secondi nella maggior parte degli strumenti video IA), sensazione di framerate (24fps cinematografico, 60fps fluido), aspect ratio (16:9, 9:16, 2.39:1) e texture pellicola (grana, bokeh, lens flare).
Combinato:
*«[Soggetto + azione], [ambiente], [movimento camera + inquadratura], [illuminazione + colore], [durata + specs tecniche].»*
Questa è la tua formula. Tutto ciò che segue ne è una variazione.
Scheda di riferimento del linguaggio camera
Non serve la scuola di cinema. Servono le parole giuste. Ecco i termini camera a cui i modelli video IA rispondono meglio:
| Termine | Categoria | Descrizione |
|---|---|---|
| Dolly in/out | Movimento | La camera si muove fisicamente verso o lontano dal soggetto |
| Tracking shot | Movimento | La camera si muove parallelamente al soggetto |
| Gru / jib su | Movimento | La camera sale verticalmente, spesso per rivelazioni |
| Pan | Movimento | Rotazione orizzontale su un punto fisso |
| Tilt | Movimento | Rotazione verticale su un punto fisso |
| Orbita / 360° | Movimento | La camera gira attorno al soggetto |
| Handheld | Movimento | Leggero tremolio, stile documentaristico |
| Statica | Movimento | Bloccata, senza movimento (usare con parsimonia per impatto) |
| Whip pan | Movimento | Snap orizzontale rapido (buono per transizioni) |
| Push-in | Movimento | Dolly lento combinato con leggero zoom |
| Campo lunghissimo (EWS) | Inquadratura | Soggetto piccolo in vasto ambiente |
| Campo lungo (WS) | Inquadratura | Corpo intero o scena completa |
| Campo medio (MS) | Inquadratura | Dalla vita in su |
| Primo piano (CU) | Inquadratura | Volto o dettaglio riempie l'inquadratura |
| Primissimo piano (ECU) | Inquadratura | Un solo dettaglio (occhio, texture, goccia) |
| Over-the-shoulder (OTS) | Inquadratura | Inquadratura classica di dialogo |
| Vista aerea / top-down | Inquadratura | Direttamente dall'alto |
| Controppicciato | Inquadratura | Camera sotto il soggetto, potere/drama |
| Angolo olandese | Inquadratura | Inquadratura inclinata, tensione/disagio |
| Bassa profondità di campo | Obiettivo e ottica | Soggetto nitido, sfondo sfocato (bokeh) |
| Alta profondità di campo | Obiettivo e ottica | Tutto nitido (stile Wes Anderson) |
| Anamorfico | Obiettivo e ottica | Widescreen con lens flare orizzontali |
| Macro | Obiettivo e ottica | Dettaglio estremo in primo piano |
| Distorsione grandangolare | Obiettivo e ottica | Prospettiva esagerata |
| 35mm / 50mm / 85mm | Obiettivo e ottica | Focali cinematografiche standard |
Usa due o tre termini per prompt. Oltre, il modello potrebbe prioritizzare quello sbagliato.
Oltre 20 modelli di prompt video cinematografici
Ogni modello sotto è pronto da copiare. Sostituisci i segnaposto tra parentesi quadre con il tuo soggetto. Tutti includono la formula in cinque parti.
Prodotto e commercial (5 modelli)
Modello 1 — Rivelazione prodotto hero
Dolly-in lento verso [prodotto] centrato su un piedistallo in [materiale superficie], luce chiave unica morbida dall'alto a sinistra, sfondo gradiente scuro verso il nero, bassa profondità di campo con bokeh cremoso, leggero sweep luminoso sulla superficie prodotto che rivela la texture, 24fps cinematografico, 6 secondi, 16:9.
Modello 2 — Orbita prodotto 360°
Orbita fluida a 360 gradi attorno a [prodotto] su superficie nera riflettente, illuminazione studio a tre punti con rim light morbido sui bordi, sfondo minimal pulito, dettaglio macro della texture superficie, movimento gimbal stabile, 8 secondi, 16:9.
Modello 3 — Prodotto lifestyle in contesto
Tracking shot medio che segue [persona] che usa [prodotto] in un [luogo — caffè, home office, palestra], luce naturale da finestra con color grade caldo, bassa DOF che mantiene il prodotto a fuoco mentre lo sfondo sfuma morbidamente, movimento candid autentico, 24fps, 7 secondi, 16:9.
Modello 4 — Unboxing / rivelazione dettaglio
Primissimo piano di mani che aprono [confezione prodotto], rivelazione con tilt-up lento al sollevare il coperchio, illuminazione tungsteno calda laterale, bassa profondità di campo, particelle di polvere visibili nel fascio luminoso, dettaglio texture qualità ASMR, 5 secondi, 9:16 verticale.
Modello 5 — Splash / prodotto dinamico
Piano cinematografico ad alta velocità di [liquido — acqua, caffè, vino] che schizza attorno a [prodotto], sfondo nero, illuminazione laterale drammatica che congela le gocce a mezz'aria, estetica camera Phantom, dettaglio ultra nitido, 3 secondi, 16:9.
Brand story e narrativa (4 modelli)
Modello 6 — Origin story / laboratorio artigianale
Piano documentaristico handheld dentro [laboratorio artigianale — panificio, studio, fucina], illuminazione pratica calda da lampade pendenti, mani di [artigiano] che lavorano su [artigianato/prodotto], bassa DOF, grana pellicola naturale, mood intimo e autentico, 8 secondi, 16:9.
Modello 7 — Viaggio / montaggio travel
Piano drone aereo che scivola su [paesaggio — costa, valle montana, skyline urbano] all'ora dorata, avanzamento lento con leggera discesa, color grade caldo ricco, lens flare anamorfico quando il sole entra nell'inquadratura, mood epico ed espansivo, 6 secondi, 2.39:1 widescreen.
Modello 8 — Ritratto emotivo
Push-in lento in primo piano sul volto di [persona], luce morbida da finestra a sinistra con illuminazione Rembrandt sottile, espressione che cambia sottilmente da neutrale a [emozione — sorriso, determinazione, meraviglia], bassa DOF, sfondo completamente dissolto, 24fps, 5 secondi, 16:9.
Modello 9 — Trasformazione prima/dopo
Piano split-dolly che parte ampio su [stato «prima» — stanza vuota, ingrediente crudo, tela bianca], transizione fluida mentre la camera avanza e la scena si trasforma in [stato «dopo» — stanza arredata, piatto finito, opera completata], continuità luminosa seamless, 8 secondi, 16:9.
Social media e short-form (4 modelli)
Modello 10 — Hook / interruzione pattern
Whip pan da movimento sfocato a messa a fuoco nitida su [soggetto], illuminazione ad alto contrasto, color grade audace in [colore — teal e arancio, rosa neon], energia rapida, 2 secondi, 9:16 verticale, progettato come apertura video.
Modello 11 — POV / prima persona
POV in prima persona entrando in [luogo — mercato, foresta, terrazza], camera handheld con oscillazione naturale, [dettagli ambiente — folla, luce solare tra gli alberi, luci urbane], immersivo e immediato, 6 secondi, 9:16 verticale.
Modello 12 — Processo soddisfacente
Piano statico top-down di [processo — versare, mescolare, disporre, dipingere] su [superficie] pulita, illuminazione morbida uniforme, composizione simmetrica soddisfacente, azione continua fluida, qualità visiva ASMR, 7 secondi, 1:1 quadrato.
Modello 13 — Loop sfondo per testo
Sfondo movimento astratto lento — [seta fluida, campo particelle, light leaks, onde gradiente] in [colori brand], movimento continuo sottile adatto a overlay testo, morbido e non distraente, sensazione loop seamless, 5 secondi, 9:16 verticale.
Mood e atmosfera (4 modelli)
Modello 14 — Piano di stabilimento cinematografico
Campo lunghissimo aereo di [città/landmark] all'[ora blu/alba], movimento lento gru ascendente che rivela la scala, luci città che si accendono, color grade blu freddo con accenti caldi, foschia atmosferica, look film 24fps, 8 secondi, 2.39:1.
Modello 15 — Noir / interno moody
Campo medio statico lungo un [corridoio/passaggio/vicolo], singola fonte luce dura in fondo che crea ombre lunghe, silhouette di figura che cammina verso la camera, bianco e nero ad alto contrasto con leggera desaturazione, tensione e mistero, 6 secondi, 16:9.
Modello 16 — Natura / serenità
Tracking shot lento attraverso [foresta/prato/giardino], luce screziata attraverso [chioma/fogliame], brezza leggera che muove la vegetazione, bassa DOF con foglie in primo piano che incorniciano, pacifico e meditativo, color grade naturale, 8 secondi, 16:9.
Modello 17 — Notte urbana / cyberpunk
Tracking shot controppicciato attraverso [strada/vicolo urbano] bagnato di notte, neon riflessi nelle pozzanghere, vapore che sale dalle bocche d'aerazione, color grade blu-viola moody, lens flare anamorfici dai cartelli, obiettivo 35mm, 7 secondi, 2.39:1.
Astratto e creativo (3 modelli)
Modello 18 — Sfondo tipografia cinetica
Movimento fluido astratto di [inchiostro in acqua / fumo / metallo liquido] in [palette colori], obiettivo macro, alto contrasto su sfondo nero, movimento organico ipnotico, adatto come sfondo sequenza titoli, 6 secondi, 16:9.
Modello 19 — Morph / elemento transizione
Primo piano di [oggetto A] che si trasforma/morpha fluidamente in [oggetto B], metamorfosi seamless, illuminazione studio con sfondo gradiente morbido, transizione visiva pulita e soddisfacente, 4 secondi, 1:1 quadrato.
Modello 20 — Light painting / sensazione lunga esposizione
Estetica lunga esposizione di [scie luminose — fari auto, stellina, fibra ottica] che si muovono in [ambiente scuro], scie colorate vivaci su nero profondo, etereo e artistico, 5 secondi, 16:9.
Modelli bonus (3 in più)
Modello 21 — Intervista / talking head
Campo medio stretto di [persona] che parla direttamente alla camera, luce chiave morbida a 45° a destra, fill light sottile, sfondo [ufficio/studio/casa] sfocato con bokeh, professionale ma caldo, leggero movimento naturale della testa, 8 secondi, 16:9.
Modello 22 — Food / hero culinario
Primo piano slow-motion di [azione food — filo di formaggio, salsa versata, vapore, coltello che taglia], illuminazione overhead calda, bassa DOF, color grade appetitoso ricco, 24fps rallentato per sensazione lussuosa, 4 secondi, 9:16 verticale.
Modello 23 — Fashion / movimento editoriale
Campo medio slow-motion di [modello] [che cammina/gira/drappeggia tessuto] in [ambientazione minimalista], illuminazione alta moda con chiave direzionale forte e ombre profonde, color grade desaturato con un colore accento, compressione obiettivo 85mm, 6 secondi, 9:16 verticale.
Come adattare i modelli al tuo brand
Copiare i modelli ti porta all'80 %. Il restante 20 % rende il video tuo.
Fissa le tue costanti visive. Scegli uno stile di illuminazione, una direzione di color grade e una preferenza di movimento camera per il tuo brand. Usali in modo coerente in ogni modello. Un brand che usa sempre luce laterale calda e dolly-in lenti sembra coerente. Uno che cambia stile ogni video sembra casuale.
Sostituisci soggetti generici con dettagli specifici del brand. «Prodotto» diventa «flacone skincare bianco opaco con tappo dorato». «Persona» diventa «donna sui 30 anni, trucco naturale, camicia di lino». La specificità impedisce all'IA di cadere nell'estetica stock footage.
Adatta l'aspect ratio alla piattaforma prima di generare. Verticale (9:16) per TikTok, Reels e Stories. Orizzontale (16:9) per YouTube e siti web. Widescreen (2.39:1) per film di brand cinematografici. Generare nel rapporto sbagliato e ritagliare dopo distrugge la composizione.
Costruisci una libreria di prompt. Salva i tuoi prompt migliori con note su cosa ha funzionato. Dopo dieci video, avrai una libreria di modelli specifica del brand più preziosa di qualsiasi lista generica.
Errori comuni (e come correggerli)
Errore 1: Descrivere una foto, non un piano. Se il tuo prompt funziona anche come prompt immagine, mancano movimento camera e azione temporale. Fix: aggiungi «dolly-in lento per 5 secondi» o «tracking shot che segue il soggetto da dietro».
Errore 2: Troppi aggettivi, pochi sostantivi. «Bello, stupendo, professionale, capolavoro cinematografico di alta qualità» non dice nulla all'IA. Fix: sostituisci gli aggettivi con termini visivi concreti — tipo obiettivo, direzione luce, tipo movimento.
Errore 3: Ignorare la durata. Azioni diverse richiedono tempi diversi. Rivelazione prodotto: 6–8 secondi. Transizione whip pan: 2 secondi. Fix: specifica sempre la durata.
Errore 4: Istruzioni contraddittorie. «Camera handheld tremolante, movimento perfettamente stabile e fluido» confonde il modello. Fix: scegli un comportamento camera e mantienilo.
Errore 5: Nessuna iterazione. La prima generazione è una bozza, non un finale. Fix: regola una variabile alla volta — movimento camera, poi illuminazione, poi color grade. Non riscrivere l'intero prompt ogni volta.
Usare prompt cinematografici in Lovart
Il ChatCanvas di Lovart supporta la generazione video accanto ai workflow immagine e design — puoi sviluppare il tuo prompt cinematografico, generare un video, valutare il risultato e affinare il prompt nella stessa conversazione.
Workflow pratico:
- Inizia con un modello di questa guida. Incollalo in ChatCanvas e sostituisci i segnaposto.
- Genera una prima bozza. Valuta una cosa: la camera si è mossa come descritto?
- Affina una variabile. Movimento sbagliato? Regola solo la Parte 3 (camera). Mood sbagliato? Regola la Parte 4 (illuminazione/colore).
- Percorso immagine-a-video — quando hai già un frame hero. Genera prima l'immagine statica, poi anima con un prompt di movimento focalizzato su comportamento camera e azione del soggetto.
- Esporta per la piattaforma. Genera nell'aspect ratio target. Non ritagliare dopo — ri-prompta con il rapporto corretto.
L'obiettivo non è una prima generazione perfetta. È un sistema di prompt che produce risultati cinematografici in modo coerente entro la terza iterazione.
FAQ
D: Quanto deve essere lungo un prompt video IA?
Punta a 40–80 parole. Prompt più corti lasciano troppo ai default del modello. Prompt più lunghi (100+ parole) possono confondere il modello con istruzioni contraddittorie. La formula in cinque parti cade naturalmente nel sweet spot.
D: Devo conoscere la terminologia cinematografica?
Un vocabolario camera di base aiuta enormemente — ma non serve la scuola di cinema. La scheda di riferimento in questa guida copre il 90 % di ciò che ti serve. Inizia con «dolly-in lento», «bassa profondità di campo» e «illuminazione ora dorata» e espandi da lì.
D: Qual è la durata migliore per clip video IA?
La maggior parte degli strumenti video IA produce i migliori risultati tra 3 e 8 secondi. Clip più corti (2–3 secondi) funzionano per transizioni e hook. Clip più lunghi (8–10 secondi) sono possibili ma possono mostrare degradazione della qualità nella coerenza del movimento. Per contenuti più lunghi, genera più clip e montale insieme.
D: Posso usare questi prompt su diversi strumenti video IA?
Sì. La formula in cinque parti e il linguaggio camera sono agnostici rispetto agli strumenti. Modelli diversi possono interpretare i termini leggermente diversamente — «lens flare anamorfico» può essere più forte in uno strumento — ma la struttura funziona ovunque. Itera per strumento.
D: Come faccio a far sembrare un video IA meno «generato da IA»?
Tre cose: aggiungi grana pellicola o texture («sottile grana pellicola 35mm»), usa movimento camera imperfetto («leggero oscillazione handheld» invece di gimbal perfettamente liscio), ed evita color grade oversaturati. La perfezione suona artificiale. L'imperfezione controllata suona cinematografica.
D: Generare video direttamente o immagine prima e poi animare?
Immagine prima ti dà più controllo su composizione e aspetto del soggetto. Testo-a-video diretto ti dà più controllo su movimento e comportamento camera. Per contenuti prodotto e brand, immagine prima è spesso più affidabile. Per clip atmosferici e astratti, testo-a-video funziona bene.
D: Posso mantenere coerenza visiva tra più clip video IA?
Sì — fissando la Parte 4 (illuminazione e colore) e la Parte 5 (specs tecniche) in tutti i prompt, e mantenendo descrizioni soggetto identiche. Alcuni strumenti supportano anche immagini di riferimento stile. Su Lovart, definisci il tuo stile visivo una volta e applicalo a ogni generazione.
D: Quale aspect ratio devo usare?
9:16 per TikTok, Instagram Reels e YouTube Shorts. 16:9 per YouTube long-form, siti web e presentazioni. 1:1 per feed Instagram. 2.39:1 per film di brand cinematografici e contenuto hero. Genera sempre nativamente — non ritagliare.
Una cosa da provare oggi
Scegli il Modello 1 (Rivelazione prodotto hero) o il Modello 14 (Piano di stabilimento cinematografico) — quello più vicino a ciò che ti serve davvero.
Apri Lovart ChatCanvas. Incolla il modello. Sostituisci i segnaposto con il tuo soggetto, superficie e mood specifici. Genera una volta.
Poi cambia solo il movimento camera. Se hai iniziato con «dolly-in lento», prova «orbita lenta» o «gru su». Rigenera. Confronta i due risultati.
Vedrai immediatamente cosa fa il linguaggio camera alla sensazione di un clip — e non scriverai mai più «cinematografico, 4K, professionale» come prompt.
