Gemini è ora in grado di analizzare più immagini in contemporanea


L’intelligenza artificiale di Google continua la sua evoluzione e, passo dopo passo, cerca di colmare il divario con i concorrenti più agguerriti. Parliamo di Google Gemini, che sta finalmente introducendo una funzionalità molto attesa da chi utilizza l’IA per interagire con le immagini: l’upload multiplo direttamente nei prompt.

Se finora eravate limitati a una sola immagine per volta nell’interfaccia web, sappiate che le cose stanno cambiando, avvicinando Gemini alle capacità già offerte da tempo da ChatGPT sul web. Ma attenzione, la novità porta con sé alcune considerazioni importanti: la distribuzione è ancora agli inizi e ci sono dettagli cruciali da conoscere.

L’upload multi-immagine su Google Gemini è realtà: più potente, ma il rollout è lento e non per tutti

Le prime segnalazioni arrivano, come spesso accade, dalla community online, in particolare da Reddit. Alcuni utenti in possesso di un abbonamento Gemini Advanced hanno notato la possibilità di caricare più file immagine all’interno della stessa richiesta sull’interfaccia web dell’assistente AI.

Stando a quanto emerso, questa novità sembra legata all’utilizzo del modello Gemini 2.0 Flash, una versione che punta sulla rapidità di elaborazione, adatta alla maggior parte degli scenari d’uso. Un utente ha persino condiviso uno screenshot (che trovate qui sotto) dimostrando come sia riuscito a combinare tre personaggi provenienti da immagini distinte in un’unica creazione AI, evidenziando le potenzialità creative e pratiche di questa feature.

Tuttavia, è fondamentale mettere le mani avanti: non si tratta ancora di una distribuzione su larga scala. Come confermato da diverse testimonianze online e anche dalle nostre verifiche dirette (dove, pur avendo sottoscrizioni Advanced attive, non abbiamo ancora accesso alla funzione), siamo di fronte a un classico rollout graduale (‘staged rollout‘, per usare il termine tecnico).

Al momento, per molti utenti, passando il mouse sull’icona ‘+’ per aggiungere file dopo aver caricato una prima immagine, un tooltip ricorda ancora che “è supportato solo un singolo file immagine”. Nulla di particolarmente nuovo: questo approccio scaglionato è tipico di Google per monitorare l’implementazione e raccogliere feedback prima di un rilascio globale.

Resta inoltre l’incognita sulla disponibilità per gli utenti della versione gratuita di Gemini: questa comoda funzionalità arriverà anche per loro o rimarrà un’esclusiva legata all’abbonamento Advanced? Al momento non ci sono certezze in merito. A questo si aggiunge un’altra nota, potenzialmente dolente, riportata dai primi utilizzatori: sembra che la qualità delle immagini generate da Gemini partendo da input multipli non sia ancora eccezionale. Questo aspetto, se confermato, potrebbe limitarne l’utilità pratica in determinati contesti dove la resa visiva è fondamentale.

Nonostante le limitazioni attuali e le incertezze, le potenzialità pratiche dell’upload multi-immagine sono innegabili. Pensate, ad esempio, alla possibilità di fornire a Gemini più foto di una pianta scattate da angolazioni diverse per ottenerne un’identificazione più accurata, oppure di confrontare visivamente più prodotti, o ancora di combinare elementi da più fonti visive per progetti creativi, come dimostrato dall’esempio su Reddit. Si tratta di scenari d’uso concreti che aumentano la versatilità dello strumento.

Del resto, che Google stesse lavorando a questa implementazione non è una sorpresa assoluta. Indiscrezioni in tal senso circolavano già dallo scorso marzo, e noi stessi avevamo precedentemente individuato indizi sull’arrivo della funzione nell’app Android di Gemini.

Questo fa ben sperare per una futura disponibilità più ampia e coerente su tutte le piattaforme su cui Gemini è presente. Nel frattempo, ricordiamo che Google sta anche distribuendo, sempre con la logica del rollout graduale e in oltre 45 lingue, nuovi strumenti di editing integrati in Gemini. Questi ultimi permettono di modificare sia le immagini caricate da voi utenti sia quelle generate dall’IA direttamente all’interno dell’assistente (su web e app), consentendo di cambiare sfondi, aggiungere o rimuovere oggetti, applicare stili e altro ancora, offrendo un controllo creativo maggiore.

Google Gemini sta compiendo un altro passo avanti per arricchire le sue capacità multimediali e tentare di tenere il passo, o addirittura superare, rivali come ChatGPT. L’introduzione dell’upload multi-immagine sul web, seppur al momento circoscritta ad alcuni abbonati Advanced e distribuita con evidente lentezza, apre scenari d’uso decisamente interessanti. Resta ora da vedere quanto rapidamente la funzione verrà estesa a un pubblico più vasto, se verrà concessa anche agli utenti della versione gratuita e, non meno importante, se Google interverrà per ottimizzare la qualità dell’output visivo.

Potrebbero interessarti anche:



Vedi Post Originale: https://www.tuttoandroid.net/news/2025/05/05/google-gemini-analisi-immagini-multiple-1092942/


0 Comments

Lascia un commento