di Francesco Pungitore
La corsa all'immagine artificiale perfetta ha un nuovo protagonista — che in realtà è un volto già noto. Midjourney, la piattaforma che dal 2022 ha ridefinito il rapporto tra prompt testuale e output visivo, ha rilasciato la versione 8 Alpha del suo motore generativo. Non si tratta di un ritocco cosmetico: il codebase è stato riscritto da zero, con un'architettura completamente nuova che segna un cambio di filosofia rispetto al modello V7, tuttora attivo come opzione predefinita.
Cinque volte più veloce, due volte più definito
Il primo impatto è cronometrico. Le immagini che con V7 richiedevano dai trenta ai sessanta secondi vengono ora generate in meno di dieci. È il tipo di miglioramento che cambia il flusso di lavoro: dove prima si lanciava un prompt e si passava ad altro, ora il ciclo di iterazione diventa quasi conversazionale. A supporto di questa velocità, l'interfaccia web su alpha.midjourney.com è stata completamente ridisegnata con una visualizzazione a griglia e pannelli laterali per i parametri.
Ma la novità più attesa riguarda la risoluzione. Con il parametro --hd, V8 genera immagini nativamente a 2048×2048 pixel — senza ricorrere all'upscaling artificiale che nelle versioni precedenti introduceva artefatti e perdita di nitidezza. Il costo, per ora, è significativo: quattro volte i GPU minutes standard. Una scelta che Midjourney potrebbe rivedere con l'uscita della versione stabile, attesa tra fine aprile e maggio 2026.
Il testo non è più un problema (o quasi)
Chi lavora con l'AI generativa conosce bene il tallone d'Achille storico di questi modelli: il testo. Lettere invertite, parole senza senso, font improbabili. V8 Alpha compie un salto generazionale su questo fronte. Inserendo il testo desiderato tra virgolette nel prompt — ad esempio a poster with the text “Milano 2026” — il modello lo renderizza con alta fedeltà. Segnali stradali leggibili, etichette pulite, tipografia coerente su poster e copertine: non siamo ancora alla perfezione, ma la distanza dal passato è evidente.
Un modello che ascolta alla lettera
Il cambiamento più sottile, e forse più importante, riguarda il modo in cui V8 interpreta le istruzioni. Dove V7 si comportava come un artista che “interpretava” liberamente il brief — aggiungendo atmosfera, modificando composizioni, prendendo licenze creative — V8 esegue. Descrizioni con più personaggi distinti, relazioni spaziali precise, negazioni complesse: il modello le rispetta.
È un'arma a doppio taglio. Chi era abituato a prompt brevi e poetici potrebbe trovarsi davanti a risultati più “piatti” del previsto. V8 premia la specificità tecnica: descrivere la luce come “single overhead key light with no fill, hard shadows” funziona meglio di un generico “dramatic lighting”. Il passaggio da un approccio evocativo a uno descrittivo-cinematografico è il vero adattamento richiesto agli utenti.
Anatomia e fisica della luce
Le mani a sei dita e i volti asimmetrici sono stati a lungo il marchio involontario dell'AI generativa. V8 riduce drasticamente questi problemi: proporzioni corporee, dita, fisionomie facciali sono gestite con maggiore accuratezza. La resa fisica della luce — riflessi nel vetro, scattering subsuperficiale sulla pelle, direzione delle ombre — passa da “atmosferica” a “fisicamente corretta”. Un dettaglio che conta soprattutto per chi produce asset commerciali, mockup di prodotto o contenuti editoriali.
Cosa manca ancora
Siamo in alpha, e si vede. L'image prompting e l'Omni Reference non sono ancora disponibili. Il modello soffre di un fenomeno di age drift — i soggetti giovani vengono spesso resi più maturi del richiesto — e occasionalmente produce un curioso “effetto Minecraft”, con texture a blocchi su determinati tipi di prompt. La coerenza tra le quattro immagini di uno stesso set resta variabile: tre eccellenti e una fuori target è un pattern ricorrente. Manca inoltre il Draft Mode, la modalità a bassa risoluzione ed economica che in V7 permette esplorazioni rapide ad alto volume.
La roadmap: cosa aspettarsi nei prossimi mesi
Secondo l'Office Hours del team Midjourney del 25 marzo 2026, la versione stabile V8.1 è attesa entro sessanta giorni, con miglioramenti all'estetica di default e una probabile democratizzazione della risoluzione 2K. In cantiere c'è un Edit Model dedicato — inpainting, outpainting, riferimenti multipli per personaggi e oggetti, controlli camera — che verrà costruito sopra V8 una volta stabilizzata. Le prime versioni interne, a detta del team, superano già le capacità dell'attuale Omni Reference.
Più avanti nel 2026 sono attesi V9 (stesso approccio architetturale di V8 ma con un modello più grande e più dati), Midjourney Video V2 con supporto audio per l'estate, e Niji 8, la versione specializzata in stile anime che sfrutterà la nuova architettura.
Chi dovrebbe provare V8 Alpha oggi
V8 Alpha è incluso in tutti i piani di abbonamento attivi, dal Basic al Mega. L'accesso avviene esclusivamente via web su alpha.midjourney.com — niente Discord, niente app mobile. Per chi produce contenuti professionali — fotorealismo, asset commerciali, materiali con testo integrato — il salto qualitativo giustifica il passaggio immediato. Per chi lavora nell'illustrazione artistica, nei mood evocativi, nella sperimentazione ad alto volume, V7 resta probabilmente la scelta più efficiente, almeno fino all'arrivo della versione stabile.
Il messaggio di fondo è chiaro: Midjourney non sta inseguendo la concorrenza di Flux, DALL·E o Stable Diffusion con aggiornamenti incrementali. Ha scelto di ricominciare da zero, puntando su precisione, velocità e controllo. Il prezzo di questa ambizione è una fase alpha con limiti evidenti. La promessa, però, è quella di un modello che per la prima volta fa esattamente quello che gli chiedi — né più, né meno. [07.04.2026]