Amazon lancia la sua IA generativa da testo a immagine, Titan
(Tecnologia) - Amazon sta entrando nel mondo della generazione di immagini AI con il rilascio del suo modello Titan basato sulla tecnologia text-to-image. Presentato durante la conferenza AWS re:Invent, il generatore di immagini Titan è in grado di creare immagini di "qualità da studio" e si distingue per le sue misure di sicurezza. Titan non è un'app o un sito web indipendente, ma uno strumento che i programmatori possono utilizzare per sviluppare i propri generatori di immagini basati su questo modello: per usarlo, è necessario accedere ad Amazon Bedrock. Swami Sivasubramanian, vice presidente di AWS per database, analisi e apprendimento automatico, ha presentato in anteprima il Generatore di Immagini Titan durante il suo discorso principale, evidenziando la capacità del modello di non solo creare un'immagine a partire da un prompt in linguaggio naturale, ma anche di modificare gli sfondi. Questo strumento è principalmente rivolto ad un pubblico aziendale, a differenza dei generatori di immagini più orientati al consumatore, come DALL-E di OpenAI.
Tutte le immagini create con Titan includeranno ciò che Amazon ha definito filigrane invisibili. Vasi Philomin, vice presidente per l'AI generativa presso AWS, ha dichiarato che ciò fa parte degli impegni volontari firmati da Amazon con la Casa Bianca a luglio. “Desideravamo un modo per contrassegnare un'immagine come creata con l'AI, e specificamente con il Generatore di Immagini Titan, che non interferisse con il visivo, senza latenza, e che non potesse essere ritagliato o compresso”, ha detto Philomin in un'intervista. Ha aggiunto che la filigrana non è confinata ai metadati del file. Tuttavia, la rilevazione della filigrana invisibile presenta alcune sfide. Amazon ha creato un'API a cui le persone possono connettersi e poi inviare l'immagine per verificarne la provenienza. Philomin ha spiegato che ciò è stato progettato intenzionalmente: dopotutto, Titan non è un prodotto finito ma un modello, quindi i programmatori che lavorano con il generatore di immagini sceglieranno come fornire queste informazioni agli utenti.
Sivasubramanian ha inoltre annunciato la disponibilità generale di altri modelli Titan: Titan Text Lite, un modello più piccolo utilizzato per compiti di generazione di testo più leggeri come la redazione di testi pubblicitari, e Text Express, che è destinato a usi più ampi come le app di chat conversazionali. Amazon estenderà inoltre l'indennità di copyright ai clienti che utilizzano i suoi modelli fondamentali Titan, inclusi quelli testo-immagine. Fornirà anche copertura legale alle persone che utilizzano qualsiasi applicazione AI creata da Amazon, anche se l'app ha utilizzato un modello fondamentale diverso trovato nel suo repository di modelli AI Bedrock, come Llama 2 di Meta o Claude 2 di Anthropic. Queste app includono AWS HealthScribe, CodeWhisperer, Amazon Personalize, Amazon Lex e Amazon Connect Contact Lens.