Fala Gaiotto - funnelRAG: Evolução na Recuperação Progressiva em Modelos de Linguagem

Conheça o funnelRAG, um modelo inovador que transforma a recuperação progressiva de dados para otimizar grandes modelos de linguagem (LLMs).

O que é funnelRAG e sua Importância para RAG

O funnelRAG é uma nova abordagem para soluções de Geração Aumentada por Recuperação (RAG). Sua proposta combina eficiência e eficácia ao aplicar um processo progressivo de recuperação de dados com granularidade de bruta (coarse) para refinada (fine).

Atualmente, frameworks RAG são amplamente usados para fornecer informações não paramétricas a modelos de linguagem, como o lightRAG. No entanto, as soluções convencionais enfrentam desafios de escalabilidade e precisão. O funnelRAG resolve essas limitações por meio de uma estrutura que diminui a sobrecarga dos recuperadores, aprimorando a qualidade e o desempenho da recuperação.

Como Funciona o funnelRAG

A recuperação progressiva no funnelRAG é dividida em três fases principais: recuperação, pré-ranqueamento e pós-ranqueamento. Cada fase adota diferentes níveis de granularidade, garantindo que a carga de processamento seja distribuída de forma equilibrada entre os módulos recuperadores.

Recuperação Inicial

O processo começa agrupando grandes volumes de dados em clusters com até 4.000 tokens, que são segmentados em partes menores à medida que o processo avança. Isso reduz o número de candidatos e melhora a eficiência.

Pré-Ranqueamento

Após a recuperação inicial, o sistema aplica um cross-encoder para selecionar os documentos mais relevantes entre as unidades agrupadas. Nessa fase, a granularidade é reduzida para documentos menores, otimizando a precisão sem comprometer a eficiência.

Pós-Ranqueamento

Por fim, no pós-ranqueamento, cada documento é segmentado em passagens curtas. Essa abordagem preserva o contexto e permite que o modelo Fusion-in-Decoder (FiD) aplique atenção cruzada para identificar as informações mais relevantes. A técnica de Later Chunking garante que os dados sejam fragmentados apenas no final do processo, mantendo a integridade contextual.

Vantagens da Abordagem Progressiva

Eficiência na Recuperação

A divisão do processo em etapas permite que o funnelRAG atue de forma eficiente, economizando 40% do tempo de processamento em comparação com abordagens convencionais.

Aumento da Precisão

O uso de granularidade adaptativa melhora a capacidade do sistema em identificar passagens relevantes, aumentando o recall de respostas e garantindo mais precisão nas respostas geradas.

Balanceamento de Carga

O funnelRAG distribui a carga de trabalho entre recuperadores esparsos e densos. Assim, os recuperadores mais simples lidam com grandes volumes de dados, enquanto os mais complexos se concentram em tarefas críticas.

Impacto nos Resultados

Experimentos realizados em dois datasets conhecidos para aplicação de estudos, tais como:

Natural Questions (NQ) – contém perguntas reais feitas por usuários, com respostas baseadas em documentos da Wikipedia;
TriviaQA (TQA) – dataset com perguntas do tipo trivia e respostas extraídas de várias fontes.

Demonstraram que o funnelRAG melhora o desempenho dos modelos de geração e reduz significativamente o tempo necessário para recuperação.

Observações dos Resultados nos Datasets NQ e TQA

Eficiência: A recuperação progressiva reduz o tempo de processamento em cerca de 40% em comparação com a abordagem plana.
Eficácia: A abordagem progressiva apresenta desempenho comparável ou superior ao da abordagem plana, apesar de usar menos recursos computacionais.
Balanceamento de carga: A recuperação progressiva atribui tarefas simples, porém intensivas, a recuperadores de baixa capacidade e tarefas complexas, mas menos intensivas, a recuperadores de alta capacidade. Isso melhora significativamente a eficiência sem perder precisão.

Além disso, a abordagem progressiva garantiu que as respostas fossem mais contextualizadas e precisas, atendendo melhor às necessidades de modelos como o Llama3-8B-Instruct e o Qwen2-7B-Instruct.

Desafios e Limitações

Embora eficiente, o funnelRAG apresenta algumas limitações. O uso de métricas heurísticas, como o Answer Recall (AR), pode superestimar a utilidade das passagens recuperadas. Além disso, algumas etapas do pipeline exigem ajustes manuais, como a definição do tamanho ideal dos clusters (Unidades agrupadas segmentadas em documentos individuais).

Outro desafio está na compatibilidade com diferentes recuperadores. O desempenho pode variar dependendo das características dos módulos de recuperação utilizados, exigindo personalização para cenários específicos.

O Futuro do funnelRAG e da Recuperação Progressiva

O funnelRAG representa um avanço significativo para frameworks de RAG, mas seu potencial ainda não foi totalmente explorado. Pesquisas futuras podem focar em:

Automatização da Configuração de Hiperparâmetros: visando reduzir a necessidade de ajustes manuais, potencialmente aumentando a eficiência.
Aprimoramento de Métricas: desenvolver novas métricas para avaliar melhor a relevância das respostas recuperadas.
Integração com Modelos Multimodais: expandir o uso do funnelRAG para aplicações que envolvem texto, imagens e áudio.

Conclusão

O funnelRAG oferece uma abordagem inovadora para sistemas de Geração Aumentada por Recuperação, equilibrando eficácia e eficiência por meio de uma recuperação progressiva com granularidade adaptativa. Com ganhos relevantes na precisão e redução significativa de tempo, o funnelRAG se posiciona como uma solução promissora para melhorar o desempenho de modelos de linguagem de grande escala.

funnelRAG: Evolução na Recuperação Progressiva em Modelos de Linguagem.