I ricercatori hanno mostrato uno strumento di intelligenza artificiale sperimentale in grado di manipolare completamente le immagini in pochissimo tempo. Ad esempio, deve essere possibile ruotare un volto e regolare le espressioni facciali con due clic del mouse.
Lo strumento, DragGAN, ha lo scopo di apportare modifiche specifiche a determinate parti delle immagini senza modificare l’intera immagine. Ciò costringe gli utenti a indicare due punti sulla foto; la parte da manipolare e il punto nella foto dove questa parte dovrebbe andare. Lo strumento dovrebbe fare il resto, dicono i ricercatori.
DragGAN consente a chiunque di distorcere un’immagine con un controllo preciso sul posizionamento dei pixel, manipolando la posa, la forma, l’espressione e la disposizione di varie categorie come animali, automobili, persone e paesaggi. A differenza, ad esempio, dello strumento Warp di Photoshop, i pixel esistenti non vengono modificati, ma la rete neurale crea pixel completamente nuovi.
Gli esempi presentati mostrano, tra l’altro, che lo strumento può aprire la bocca di un leone e quindi far guardare l’animale in un’altra direzione girandogli la testa. Anche i vestiti delle persone, come le maniche, sono allungati e si possono vedere braccia e gambe in movimento. Un altro esempio mostra come vengono modificati interi paesaggi.
La maggior parte delle immagini negli esempi sono generate dall’intelligenza artificiale, ma secondo i ricercatori lo strumento dovrebbe essere in grado di gestire anche foto reali. Evidenziato da una foto sorridente del presidente degli Stati Uniti Joe Biden, che in pochi minuti si trasforma in un’espressione facciale scioccata, anche la sua testa si è girata.
Secondo i ricercatori, lo strumento è in grado di ottenere “risultati realistici che tracciano costantemente la rigidità dell’oggetto, anche per scenari difficili, come parti nascoste”. La squadra promette per pubblicare il codice dello strumento su GitHub il mese prossimo.
Al progetto hanno contribuito sei ricercatori, che lavorano presso università tedesche e americane. Ha contribuito anche Abhimitra Meka, un ricercatore del dipartimento AR di Google.
“Ninja pancetta. Guru del caffè per tutta la vita. Drogato di cibo malvagio. Aspirante risolutore di problemi. Creatore tipico.”
You may also like
-
Intelligenza artificiale generativa e cybersecurity: quali rischi nel 2024
-
Elettrodomestici a portata di mano: controllare la tua casa con l’App del tuo smartphone
-
Battito cardiaco, come uno smartwatch può salvarti la vita
-
Honor 90: Il Nuovo Design Mozzafiato che Stupirà gli Appassionati di Smartphone
-
Sappiamo di più su come tenere il telefono acceso a letto con Pokémon Sleep