Che cos’è e come funziona la Generative AI?

Generative-AI

Condividi

Introduzione alla Generative AI

Per Generative Artificial Intelligence (Generative AI) si intendono tutti i sistemi di Artificial Intelligence che possono creare contenuto inedito (testo, immagini, audio, ecc) sulla base di contenuto esistente, che è stato utilizzato per addestrarli. Questi sistemi si basano su strategie di Machine Learning (ML) e, in particolare, di Deep Learning (DL), con le quali si possono creare modelli molto potenti in grado di generare contenuto sulla base dei dati utilizzati per addestrarli, senza necessità di programmare esplicitamente. 

La Generative AI è particolarmente diffusa nell’ambito del Natural Language Processing (NLP), la branca dell’AI che si occupa di sviluppare modelli in grado di comprendere e utilizzare il linguaggio umano scritto e parlato.

Esistono tantissime applicazioni della Generative AI, gli esempi più famosi sono ChatGPT, in grado di creare del testo, o MidJourney e Dall-E, due modelli che invece possono generare immagini partendo da una breve descrizione del contenuto e dello stile.

Generative AI: le caratteristiche

In generale, i modelli di Machine Learning “tradizionali” sono addestrati utilizzando dati strutturati, composti dal dato stesso e rispettiva etichetta e imparando l’associazione fra i due, e svolgono operazioni di predizione di dati futuri (modelli “predittivi”) o di classificazione/clusterizzazione (modelli “discriminativi”). I modelli generativi invece sono addestrati su dati spesso non strutturati, a volte di provenienza eterogenea, e imparano la struttura interna dei dati in modo da poter generare nuovo contenuto. Il modello statistico imparato da un modello generativo durante l’addestramento viene utilizzato per creare nuovi dati simili a quelli utilizzati per addestrarlo.

Generative-AI-funzionalità

Cosa c’è sotto la Generative AI?

I modelli generativi hanno avuto una forte accelerazione negli ultimi anni grazie all’introduzione dei Trasformer con la famosa ricerca Attention Is All You Need. I Transformer sono delle reti neurali (Neural Networks o NN) basate sul modello encoder-decoder con l’aggiunta di un meccanismo di “attenzione”. Con i Transformer, il dato viene codificato (“encoded”) per impararne la struttura interna, e poi decodificato (“decoded”) per verificare la bontà del processo. Il meccanismo di attenzione, invece, migliora il processo di apprendimento perché permette di concentrarsi sulle parti più significative del dato, tramite l’assegnazione di pesi. Rispetto ai modelli precedenti, i Transformer imparano quantità maggiori di informazioni e con maggiore precisione. I Large Language Models (LLM) come quelli utilizzati da ChatGPT ne sono un esempio. 

I Transformer non sono comunque immuni da errori: spesso generano parole o frasi insensate o grammaticalmente sbagliate, che prendono il nome di “allucinazioni” (Hallucinations). In genere sono causate da mancanza di dati, dati sbagliati o poco puliti in fase di addestramento, mancanza di contesto o di limitazioni nella risposta chiesta al modello. 

Prompt Engineering

I modelli di Generative AI generano contenuto inedito a partire da un piccolo input, in genere sotto forma di domanda o descrizione testuale, chiamato prompt. La corretta scrittura dei prompt consente di ridurre significativamente le “allucinazioni” del modello, ed è infatti recentemente nata la disciplina del Prompt Engineering con l’obiettivo di comunicare efficacemente all’AI qual è la risposta desiderata. L’idea generale è quella di includere le informazioni necessarie all’interno della domanda, anziché fornirle come contesto al modello prima di porgli la domanda. 

Alcune strategie di Prompt Engineering molto utilizzate consistono nell’aggiungere al prompt:

  • Alcuni esempi di risposta desiderata (Few-Shot Prompting)
  • Una sequenza di ragionamenti logici che accompagnano l’AI verso la risposta desiderata (Chain-of-Thought Prompting)
  • Alcuni Prompt di esempio per raffinare la risposta dell’AI  (Instruction Prompting)
  • Una sequenza di altri Prompt per decomporre il problema in più parti e risolverli ricorsivamente (Recursive Prompting)

Applicazioni di Generative AI

La generative AI ha trovato applicazioni in moltissimi settori. I modelli “Text-to-Text” sono per esempio utilizzati in ambito Marketing per generare contenuti ed email, o nel Customer Care per la creazione di chatbot intelligenti. Un’altra applicazione dalla text generation è quella di supporto alla programmazione (Generazione di codice, documentazione, sviluppo di web app). I modelli “Text-to-Image” consentono di generare immagini a partire da una descrizione, e sono utilizzati nei settori del Marketing, Social, Advertising e Design. I modelli che generano audio sono utilizzati per la creazione di sintetizzatori vocali, mentre quelli che generano video sono utilizzati nel settore del Video Editing. Nel campo farmaceutico si stanno sviluppando nuove forme di Generative AI atte a generare nuovi farmaci.

Soluzioni di Generative AI

I principali cloud provider stanno sviluppando soluzioni di Generative AI in grado di offrire modelli pre addestrati per utilizzo generico (Foundation Models) che possono essere addestrati per uno specifico caso tramite “fine tuning”, come Azure OpenAI, Google Vertex AI e AWS Bedrock. Oltre alla capacità di generare contenuti, queste soluzioni hanno il significativo vantaggio di garantire sicurezza e protezione dei dati. 

Sono inoltre presenti molte soluzioni open source, sia per l’addestramento di modelli (come il repository HuggingFace) e sia per Prompt Engineering (come il framework LangChain).

 

La Generative AI offre soluzioni innovative, ma deve essere utilizzata seguendo principi di Responsible AI, in modo da garantire precisione, imparzialità e assenza di bias nelle risposte, rispetto delle proprietà intellettuali e della privacy. 

 

Blue BIi può aiutarti nell’introduzione di sistemi Generative AI. Abbiamo infatti integrato ChatGPT nella nostra soluzione BBI x Chatbot. Se vuoi saperne di più, leggi il nostro articolo a riguardo e contattaci!

Realizziamo soluzioni di Business Intelligence & Advanced Analytics per trasformare semplici dati in informazioni di grande valore strategico.

Autore

Tabella dei Contenuti