
QUERYAUGMENT-RAG: APRIMORANDO A RECUPERAÇÃO E GERAÇÃO DE INFORMAÇÕES EM MODELOS DE LINGUAGEM DE GRANDE ESCALA
2024; Volume: 4; Issue: 6 Linguagem: Português
10.56083/rcv4n6-156
ISSN2764-7757
Autores Tópico(s)Information Science and Libraries
ResumoNos últimos anos, os modelos de linguagem de grande escala (LLMs), como GPT-3, BERT e T5, revolucionaram o processamento de linguagem natural (NLP), demonstrando notável proficiência em tarefas como tradução, sumarização e, especialmente, resposta a perguntas abertas. No entanto, os motores de busca tradicionais retornam uma lista de trechos ou links em vez de responder diretamente à pergunta, o que pode ser ineficiente. A Geração Aumentada por Recuperação (RAG) combina as forças dos sistemas de recuperação e dos modelos generativos, aprimorando as capacidades dos LLMs na provisão de informações precisas de grandes bancos de dados. Este trabalho propõe um novo framework de recuperação, QueryAugment-RAG, que integra várias técnicas avançadas para otimizar a recuperação e geração de informações. O framework divide grandes corpora de texto e tabelas em partes menores e gerenciáveis, resumindo-os com o auxílio de LLMs. A pergunta do usuário também é melhorada utilizando LLMs para facilitar a busca de trechos resumidos similares baseado no critério de similaridade de cossenos. Espera-se que o QueryAugment-RAG aprimore significativamente a eficiência, precisão e relevância da recuperação de informações em comparação com abordagens tradicionais. A combinação de técnicas de aumento de consulta, busca por similaridade semântica e sumarização contextual oferece um avanço promissor para sistemas RAG, permitindo que os LLMs forneçam respostas mais precisas e contextualmente apropriadas em diversas aplicações intensivas em conhecimento.
Referência(s)