keep in touch:
Inviaci un messaggio:
Inviando questo modulo autorizzo il trattamento dei dati forniti al solo scopo di ricevere una risposta alla mia richiesta
Redazione ABC
Se hai iniziato ad avvicinarti al mondo della generazione di immagini tramite intelligenza artificiale, probabilmente hai già sentito parlare di prompt. Ma tra il sapere che esistono e il saper scrivere un prompt davvero efficace c'è una distanza enorme — ed è esattamente quella distanza che vogliamo colmare in questo articolo.
Parleremo di AI generativa, di come funzionano i modelli per la generazione di immagini, di quale piattaforma scegliere e, soprattutto, ti daremo gli strumenti pratici per costruire prompt che producano risultati professionali e coerenti con la tua visione creativa.
Un prompt per immagini AI è un'istruzione testuale (e a volte visuale) che fornisci al modello per guidare il processo di generazione. La qualità del prompt determina in larghissima parte la qualità dell'output — ed è per questo che è nata un'intera disciplina chiamata prompt engineering.
Un prompt efficace non è semplicemente una descrizione generica come "un gatto sul tetto". È una composizione strutturata che specifica soggetto, stile, illuminazione, composizione, mood, paletta cromatica, eventuali riferimenti artistici e parametri tecnici. Più sei preciso e contestualizzato, più il modello ha informazioni su cui "lavorare" durante il processo di denoising.
Esistono tre categorie principali di prompt per la generazione visiva, che non si escludono a vicenda ma si combinano spesso in un unico input:
La risposta onesta è: dipende dall'uso che ne devi fare. Il mercato dell'AI generativa visiva si è fatto estremamente competitivo e ogni piattaforma ha punti di forza specifici.
Per generare un’immagine con AI non si utilizzano strumenti di disegno, ma parole. Bisogna descrivere ciò che si vuole ottenere nel modo più chiaro possibile: soggetto, ambiente, stile, atmosfera, qualità visiva. Questa descrizione è il prompt e rappresenta la base da cui l’intelligenza artificiale costruisce l’immagine.
Una volta definita la parte descrittiva, è possibile aggiungere istruzioni più tecniche che servono a controllare il modo in cui l’immagine viene generata. Su Midjourney questi comandi si inseriscono direttamente alla fine del prompt, dopo la descrizione, separati da uno spazio.
I parametri fondamentali da conoscere (che si inseriscono direttamente alla fine del prompt) servono per controllare aspetti tecnici dell’immagine che la descrizione testuale da sola non riesce a definire con precisione.
In pratica, mentre il prompt descrive cosa deve essere rappresentato, questi comandi indicano all’AI come deve generarlo. Si scrivono dopo la descrizione, separati da uno spazio, e funzionano come impostazioni avanzate del motore di generazione:
Midjourney supporta anche i prompt ibridi testo + immagine, una funzione molto potente che permette di guidare l’AI non solo con una descrizione scritta, ma anche con riferimenti visivi. In pratica, invece di spiegare tutto a parole, puoi mostrare al modello da quale immagine partire o quale stile imitare.
Nel prompt puoi inserire uno o più link a immagini online seguiti dalla descrizione testuale: l’AI userà quelle immagini come base visiva su cui costruire il risultato finale.
La sintassi da usare per il prompt è:
[URL immagine] [URL immagine opzionale] [descrizione testuale] --iw [peso]
Il parametro --iw (Image Weight), che si scrive alla fine del prompt come gli altri parametri, serve a stabilire quanto le immagini di riferimento devono influenzare il risultato rispetto al testo. I valori tipici vanno da 0.5 a 2 (il valore predefinito è 1).
Se imposti --iw 2, il risultato sarà molto vicino all’immagine di partenza, quasi una reinterpretazione. Con --iw 0.5, invece, il modello seguirà soprattutto la descrizione testuale, usando l’immagine solo come ispirazione.
Eccoci al cuore dell'argomento. Scrivere un buon prompt per Midjourney o altra AI generativa è una competenza che si costruisce con l'esperienza, ma ci sono principi strutturali che puoi applicare fin da subito.
La struttura raccomandata per un prompt avanzato segue questo schema:
[Soggetto principale] + [Azione o stato] + [Contesto/ambiente] + [Stile artistico] + [Illuminazione] + [Tecnica/medium] + [Parametri tecnici]
Facciamo un primo esempio pratico di come si scrive un prompt per generare immagini e come si utilizzano i parametri avanzati, di cui abbiamo parlato prima:
"Una botanica che esamina un esemplare di pianta bioluminescente, interno di una serra fitta e invasa dalla vegetazione di notte, illuminazione cinematografica con riflessi al neon blu e verdi, fotorealistico, scattato con Sony A7R V con obiettivo 50mm f/1.4, ultra-dettagliato, 8K --ar 3:2 --style raw --v 6.1"

Con questo prompt hai chiesto all’AI di generare un’immagine fotorealistica di una botanica che osserva da vicino una pianta bioluminescente all’interno di una serra molto fitta e invasa dalla vegetazione durante la notte, con un’atmosfera cinematografica caratterizzata da luci e riflessi neon blu e verdi.
Hai specificato che l’immagine deve sembrare una fotografia reale, indicando anche il tipo di fotocamera e obiettivo (Sony A7R V con 50mm f/1.4) per influenzare la resa visiva, la profondità di campo e la qualità dello scatto, e hai richiesto un livello di dettaglio molto alto in 8K. Con i parametri finali hai inoltre definito il formato dell’immagine in proporzione 3:2, uno stile più neutro e meno “artistico” grazie all’opzione raw e l’utilizzo della versione più recente del modello, così da ottenere un risultato coerente, realistico e tecnicamente molto preciso.
È una delle domande più frequenti tra chi si avvicina a questi strumenti, e la risposta è abbastanza netta: l'inglese vince, quasi sempre.
Il motivo è strutturale. Midjourney — come la maggior parte dei modelli di generazione visiva — è stato addestrato su dataset in cui la lingua dominante è l'inglese. Ciò significa che le associazioni semantiche tra parole e concetti visivi sono molto più dense e precise in inglese che in qualsiasi altra lingua.
Ad esempio, quando scrivi “shallow depth of field”, il modello richiama un insieme molto preciso di immagini fotografiche con sfondo sfocato, soggetto nitido e resa tipica delle ottiche luminose. Se scrivi semplicemente “sfondo sfocato”, il risultato può essere accettabile, ma spesso meno naturale: l’AI potrebbe applicare una sfocatura uniforme, poco realistica o addirittura incoerente con la prospettiva.
Questo non significa che l'italiano non funzioni. Con Midjourney v6 e modelli come DALL·E 3, la comprensione multilingua è migliorata significativamente — puoi scrivere un prompt in italiano e ottenere risultati decenti. Ma appena il prompt si fa più articolato, con riferimenti stilistici, termini tecnici fotografici o nomi di artisti, la precisione cala rispetto all'equivalente in inglese.
Quando si scrive un prompt al fine di generare un'immagine con l'intelligenza artificiale, ci sono alcuni errori da evitare:
Il modo più rapido per capire come si scrive un buon prompt non è leggere regole astratte, ma osservare esempi concreti e capire esattamente che cosa si sta chiedendo all’AI. Ogni prompt efficace contiene indicazioni precise sul soggetto, sull’ambiente, sullo stile e sulla resa visiva finale.
"Ritratto ravvicinato di un pescatore anziano giapponese, pelle segnata dal tempo, occhi profondi, indossa una vecchia giacca indaco boro, in piedi su un porto nebbioso all’alba, luce morbida diffusa, scattato con Leica M11 con obiettivo 50mm Summilux, grana analogica, palette cromatica teal e ambra attenuata --ar 4:5 --style raw --v 6.1"

Con questo prompt hai chiesto all’AI di generare un ritratto fotografico estremamente realistico, definendo non solo la persona ma anche il contesto culturale, l’ora del giorno, il tipo di luce e perfino l’attrezzatura fotografica simulata. Tutti questi elementi servono a ottenere un’immagine che sembri uno scatto editoriale professionale, con un preciso mood cinematografico.
In dettaglio, l’indicazione della fotocamera e dell’obiettivo serve a simulare profondità di campo e qualità dell’immagine, mentre la grana analogica e la palette cromatica contribuiscono a creare un mood visivo coerente. Il parametro --ar 4:5 impone un formato verticale tipico dei ritratti fotografici, --style raw evita effetti pittorici mantenendo una resa più naturale e --v 6.1 specifica la versione del modello AI da utilizzare per ottenere il massimo livello di qualità e coerenza.
"Illustrazione minimalista di una donna che legge un libro mentre l’acqua sale intorno a lei, metafora dell’evasione, stile vettoriale piatto, palette limitata rosa polveroso e blu ardesia, sfondo bianco --ar 1:1"

In questo caso hai chiesto un’immagine concettuale, non realistica, adatta a un contesto editoriale o a una rivista. La presenza della parola “metafora” indica all’AI che non deve rappresentare solo una scena letterale ma anche un significato simbolico, mentre lo stile vettoriale e la palette limitata servono a ottenere un risultato pulito e grafico. Infine, il parametro --ar 1:1 impone un formato quadrato, tipico delle illustrazioni editoriali e dei contenuti digitali.
"Logo minimalista per una caffetteria artigianale chiamata Aurora Coffee, simbolo stilizzato di una tazza con vapore che forma un sole nascente, design vettoriale pulito, linee sottili, palette limitata nero e beige caldo, stile contemporaneo, sfondo bianco, flat design --ar 1:1 --style raw"

Qui hai chiesto all’AI di generare un logo, quindi un’immagine semplice, leggibile e scalabile, non una scena complessa o realistica. La descrizione specifica il tipo di attività, il simbolo da rappresentare e lo stile grafico (minimal, vettoriale, flat), elementi fondamentali per ottenere un risultato utilizzabile nel branding.
Inoltre, l’indicazione della palette limitata e dello sfondo bianco serve a evitare effetti pittorici o fotografici, mentre il formato quadrato (--ar 1:1) è quello più adatto ai loghi. Infine, --style raw serve a evitare l’estetica pittorica tipica di Midjourney, favorendo un risultato più pulito e neutro.
La progettazione di un logo è uno dei casi d'uso più interessanti — e più insidiosi — dell'AI generativa. Midjourney non è un software di grafica vettoriale, quindi l'output non sarà mai direttamente pronto per la stampa, ma è straordinariamente utile nella fase di ideazione e moodboard.
Le parole chiave da tenere sempre presenti per questo tipo di prompt sono: `minimal`, `single color`, `vector style`, `negative space` e `clean`. Senza questi vincoli il modello tende ad aggiungere texture, sfumature e dettagli decorativi incompatibili con un logo funzionale. Il risultato andrà poi ricostruito in Illustrator o Figma, ma avere una direzione visiva definita vale molto più di mille brief a parole.
"Flacone di profumo di lusso in vetro ambrato scuro con dettagli dorati, appoggiato su una superficie in marmo con petali di rosa secchi sparsi, illuminazione da studio morbida con luce di contorno, profondità di campo ridotta, sfondo bianco pulito, fotografia commerciale, 8K --ar 3:4 --style raw"

Qui hai chiesto all’AI di simulare una fotografia di prodotto professionale, come quelle utilizzate per cataloghi o negozi online. Ogni elemento — materiali, luce, sfondo, qualità — serve a ottenere un’immagine credibile e utilizzabile in un contesto commerciale.
Il parametro --ar 3:4 definisce un formato verticale tipico delle schede prodotto, mentre --style raw mantiene una resa fotografica realistica senza effetti artistici.
"Antica biblioteca costruita all’interno della gabbia toracica di un enorme drago fossilizzato, migliaia di candele sospese, studiosi in abiti lunghi che leggono su scrivanie di ossa scolpite, luce calda ambrata che filtra dalle ossa crepate, matte painting ultra dettagliato, inquadratura ampia --ar 16:9 --chaos 10"

Qui hai chiesto all’AI di creare un ambiente fantastico complesso, tipico della concept art per cinema o videogiochi. La descrizione definisce architettura, atmosfera, illuminazione e scala della scena, mentre il parametro di variabilità serve a ottenere versioni leggermente diverse della stessa idea per esplorare soluzioni visive alternative.
Nello specifico, il parametro --ar 16:9 impone un’inquadratura panoramica, adatta a scene ambientali, mentre --chaos 10 introduce una moderata variabilità tra le versioni generate, utile nella fase esplorativa per ottenere soluzioni visive diverse della stessa idea.
Prossima data: 12-03-2026
Durata:200 ore
Promozione a tempo
2500 €2250 €
Last Call - Risparmia il 10%
😃 Iscriviti ora alla nostra newsletter e non perdere le novità del settore
Ti potrebbe interessare
nella stessa categoria