Exemplo: Chatbot de PDF 📚#

Descrição:

Este exemplo mostra como construir um chatbot de PDF utilizando um LLM local e um modelo de embedding.

Tecnologias envolvidas:

@ Xinference como serviço de hospedagem de modelos LLM

@ LlamaIndex usado para orquestrar todo o pipeline RAG

@ Streamlit para interface interativa do usuário

Explicação detalhada sobre a funcionalidade de demonstração:

Foi criado um Dockerfile, que simplifica o processo de implantação por meio do Docker e garante fácil reprodutibilidade.
Use o Xinference para iniciar o modelo LLM e o modelo de embedding, e exponha duas portas para acessá-los.
Implemente o upload contínuo de arquivos e a comunicação interativa com o mecanismo de chat usando o Streamlit.
Document embedding speed é 5 vezes mais rápida que a API da OpenAI.
Utilize os recursos poderosos do GGML para executar o modelo na GPU, garantindo aceleração e reduzindo o tempo de espera pelo retorno.

Código-fonte

PDF Chatbot