Alimentate la vostra creatività con nuovi modelli e strumenti di media generativi

20 Mag, 2025

Eli Collins

VP, Product Management

Siamo lieti di annunciare i nostri nuovi modelli di media generativi, che segnano importanti passi in avanti nella creazione di contenuti. Questi modelli creano immagini, video e musica mozzafiato, consentendo agli artisti di dare vita alla loro visione creativa. Si tratta di strumenti straordinari con cui tutti possono esprimere le proprie idee.

Veo 3 e Imagen 4, i nostri ultimi modelli di creazione di video e immagini, vanno ben oltre la semplice realizzazione di contenuti grazie alle loro nuove funzionalità all’avanguardia. Stiamo anche ampliando l’accesso a Lyria 2, fornendo ai musicisti più strumenti per creare musica. Infine, invitiamo gli storyteller a provare Flow, il nostro nuovo strumento di produzione video basato sull’AI. Sfruttando i modelli più avanzati di Google DeepMind, Flow ti permette di creare video con funzionalità più avanzate per il controllo dei personaggi, delle scene e degli stili, per dare vita alla tua storia.

Abbiamo collaborato fianco a fianco con industrie creative (registi, musicisti, artisti, creator di YouTube) per plasmare questi modelli e prodotti in modo responsabile e per offrire ai creator nuovi strumenti con cui esprimere le potenzialità dell’AI nella loro arte.

Veo 3: video con audio per la prima volta

Veo 3, il nostro nuovo modello di creazione di video all’avanguardia, non solo migliora la qualità di Veo 2, ma è anche in grado, per la prima volta, di creare video con audio: rumori del traffico in sottofondo in una strada di città, uccellini che cantano in un parco, perfino persone che parlano.

In generale, Veo 3 è uno strumento eccellente in qualsiasi ambito, dai prompt con testo e immagini alla fisica del mondo reale fino alla sincronizzazione labiale precisa. È caratterizzato da capacità di comprensione straordinarie: puoi raccontare una breve storia nel prompt e il modello creerà una clip su ciò che hai detto. Veo 3 è disponibile per gli abbonati Ultra negli Stati Uniti nell’app Gemini e in Flow. È disponibile anche per gli utenti aziendali su Vertex AI.

Novità di Veo 2: nuove funzionalità create con e per i registi

Man mano che miglioriamo Veo 3, aggiungiamo anche nuove funzionalità al nostro popolare modello Veo 2 collaborando con creator e registi. Ecco alcune di queste nuove funzionalità disponibili da oggi:

La nostra nuova funzione di creazione di video a partire da riferimenti ti permette di fornire a Veo immagini di personaggi, scene, oggetti e perfino stili per un controllo creativo e una coerenza migliori.
I controlli della fotocamera ti aiutano a definire movimenti della fotocamera precisi, come rotazioni, carrellate e zoom, per realizzare la ripresa perfetta.
L’outpainting ti consente di espandere l’inquadratura, passando dal formato orizzontale a quello verticale e adattando facilmente il video a qualsiasi dimensione dello schermo, migliorando la scena in modo intelligente.
L’aggiunta e la rimozione di oggetti ti permette di aggiungere o cancellare gli oggetti dai video. Veo analizza le scale, le interazioni e le ombre, e sfrutta tale analisi per creare una scena naturale e realistica.

I controlli per la fotocamera e i video basati su riferimenti sono ora disponibili in Flow. Non vediamo l’ora di introdurre tutte queste nuove funzionalità nell’API di Vertex AI nelle prossime settimane e in altri prodotti nei prossimi mesi.

Flow: uno strumento per la produzione video AI progettato per Veo

Sviluppato con e per le creatività, Flow è uno strumento di produzione video AI che ti consente di creare facilmente video, scene e storie combinando i modelli più avanzati di Google DeepMind: Veo, Imagen e Gemini. Usa il linguaggio naturale per descrivere le tue riprese in Flow, gestisci i vari elementi chiave della tua storia (cast, luoghi, oggetti e stili) in un unico luogo pratico e sfrutta Flow per trasformare la tua storia in scene meravigliose.

Flow è disponibile per gli abbonati Google AI Pro e Ultra negli Stati Uniti, ma presto sarà disponibile anche in altri paesi.

Imagen 4: qualità straordinaria e tipografia superiore

Il nostro ultimo modello di Imagen combina velocità e precisione per creare immagini incredibili. Imagen 4 è caratterizzato da una nitidezza eccezionale anche nei minimi dettagli (come tessuti intrecciati, gocce d’acqua e pelo di animali) e offre risultati straordinari sia negli stili fotorealistici che in quelli astratti. Imagen 4 è in grado di creare immagini in una vasta gamma di proporzioni e con una risoluzione fino a 2k, ideale per la stampa o le presentazioni. Ortografia e tipografia sono state notevolmente migliorate, il che rende più facile la creazione di biglietti di auguri, poster e anche fumetti.

Imagen 4 è disponibile nell’app Gemini, in Whisk, Vertex AI, Presentazioni, Vids, Documenti e altri prodotti in Workspace.

Presto sarà disponibile una variante rapida di Imagen 4 che è fino a 10 volte più veloce di Imagen 3, quindi potrai realizzare le tue idee in modo ancora più veloce.

Lyria 2: composizione potente ed esplorazione senza fine

Ad aprile, abbiamo esteso l’accesso a Music AI Sandbox, basato su Lyria 2. Music AI Sandbox offre a musicisti, produttori e cantautori una serie di strumenti sperimentali che possono suscitare nuove possibilità creative e aiutare gli artisti a esplorare idee musicali uniche. L’esperienza e i preziosi feedback dell’industria musicale ci consentono di garantire che i nostri strumenti supportino la creatività, incoraggiando al contempo i creativi a sfruttare le potenzialità dell’AI nella loro arte.

Lyria 2 offre una composizione potente e un’esplorazione senza fine ed è ora disponibile per i creator tramite YouTube Shorts e per le aziende in Vertex AI. Lyria RealTime, il nostro modello interattivo di creazione di musica che supporta la modalità DJ di MusicFX, è disponibile tramite un’API e in AI Studio e consente a chiunque di creare, controllare e interpretare la musica generativa in tempo reale.

Creazione e collaborazione responsabili con la community creativa

Dal suo lancio nel 2023, SynthID ha applicato una filigrana a più di 10 miliardi di immagini, video, file audio e testi, aiutando a identificarli come contenuti generati dall’AI e a ridurre le possibilità di disinformazione e attribuzione errata. Gli output generati da Veo 3, Imagen 4 e Lyria 2 continueranno ad avere le filigrane SynthID.

Oggi siamo lieti di introdurre SynthID Detector, un portale di verifica che consente di identificare i contenuti generati dall’AI. Carica un contenuto e SynthID Detector indicherà se tutto il file o una parte di esso include SynthID.

Con tutti i nostri modelli di AI generativa, vogliamo liberare la creatività umana e consentire ad artisti e creator di realizzare le loro idee con una velocità e facilità senza precedenti.

Etichette:

Alimentate la vostra creatività con nuovi modelli e strumenti di media generativi

Novità di Veo 2: nuove funzionalità create con e per i registi

Flow: uno strumento per la produzione video AI progettato per Veo

Creazione e collaborazione responsabili con la community creativa

Post simili