Retrieval Augmented Generation (RAG)
Retrieval capabilities per potenziare l’IA generativa
Come funziona?
La RAG è utilizzata come componente all’interno di un sistema più ampio e complesso, tipicamente un motore di ricerca o un agente conversazionale.
È formata da due moduli che collaborano e interagiscono tra loro con l’obiettivo di rispondere adeguatamente alle richieste poste da un utente.
Moduli
Retrieval module
Il modulo di ricerca, quando il sistema riceve una richiesta dall’utente, recupera nella base di conoscenza i documenti più rilevanti rispetto alla query in ingresso. Ciò garantisce una migliore qualità e affidabilità delle risposte rispetto a sistemi basati unicamente sui LLM.
Generation module
Il modulo generativo formula una risposta coerente e adeguata alla richiesta, utilizzando le informazioni contenute nei documenti recuperati dall’altro modulo.
L’utilizzo di un LLM fa sì che l’intero sistema risulti linguisticamente più fluido e naturale, sia in termini di comprensione che di generazione di testi.
Esempi di applicazione
Supporto clienti
Permette di fornire risposte accurate e pertinenti alle domande dei clienti
Strumenti didattici
Implementa l’efficienza delle piattaforme educative, favorendo il processo di apprendimento
Assistenti virtuali
Genera output più accurati, migliorando l’efficacia delle risposte dei chatbot
Creazione di contenuti
Supporta nell’elaborazione di contenuti generando testo rilevante sulla base di un prompt dato
Assistenza sanitaria
Supporta i processi decisionali recuperando e generando informazioni rilevanti dalla letteratura medica
Il nostro approccio
Nella piattaforma AIWave, la RAG è basata su un’architettura che integra ulteriori tecnologie utili a migliorare le capacità di elaborazione del linguaggio naturale.
Le funzionalità di Information Retrieval sono più performanti grazie all’utilizzo di ontologie e dizionari specifici per ogni dominio.
Questa architettura permette di recuperare informazioni anche da fonti esterne, riducendo ulteriormente i carichi di lavoro affidati ai modelli generativi, risparmiando risorse computazionali e garantendo, allo stesso tempo, maggior attendibilità e controllo sulle risposte.