Retrieval Augmented Generation (RAG)
Capacidades de recuperação para potencializar a IA generativa
Como funciona?
A RAG é utilizada como um componente dentro de um sistema mais amplo e complexo, tipicamente um motor de busca ou um agente conversacional.
É composta por dois módulos que colaboram e interagem entre si com o objetivo de responder de forma adequada às solicitações feitas por um usuário.
Módulos
Módulo de Recuperação
Quando o sistema recebe uma solicitação do usuário, o módulo de recuperação busca na base de conhecimento os documentos mais relevantes em relação à consulta recebida. Isso garante uma melhor qualidade e confiabilidade das respostas em comparação com sistemas baseados exclusivamente em LLM.
Módulo de Geração
O módulo generativo formula uma resposta coerente e adequada à solicitação, utilizando as informações contidas nos documentos recuperados pelo outro módulo.
O uso de um LLM faz com que todo o sistema seja linguisticamente mais fluido e natural, tanto em termos de compreensão quanto de geração de textos.
Exemplos de aplicação
Suporte ao cliente
Permite fornecer respostas precisas e relevantes às perguntas dos clientes
Ferramentas educacionais
Aumenta a eficiência das plataformas de ensino, favorecendo o processo de aprendizagem
Assistentes virtuais
Gera respostas mais precisas, melhorando a eficácia dos chatbots
Criação de conteúdos
Auxilia na elaboração de conteúdos, gerando textos relevantes a partir de um prompt fornecido
Assistência médica
Apoia os processos de decisão, recuperando e gerando informações relevantes da literatura médica
A nossa abordagem
Na plataforma AIWave, a RAG é baseada numa arquitetura que integra tecnologias adicionais para aprimorar as capacidades de processamento de linguagem natural.
As funcionalidades de Information Retrieval tornam-se mais eficientes graças ao uso de ontologias e dicionários específicos para cada domínio.
Essa arquitetura permite recuperar informações também de fontes externas, reduzindo ainda mais a carga de trabalho dos modelos generativos, economizando recursos computacionais e garantindo, ao mesmo tempo, maior confiabilidade e controle sobre as respostas.