Exemplo: Chatbot de PDF šŸ“š#

Descrição:

Este exemplo mostra como construir um chatbot de PDF utilizando um LLM local e um modelo de embedding.

Tecnologias envolvidas:

@ Xinference como serviƧo de hospedagem de modelos LLM

@ LlamaIndex usado para orquestrar todo o pipeline RAG

@ Streamlit para interface interativa do usuƔrio

Explicação detalhada sobre a funcionalidade de demonstração:

  • Foi criado um Dockerfile, que simplifica o processo de implantação por meio do Docker e garante fĆ”cil reprodutibilidade.

  • Use o Xinference para iniciar o modelo LLM e o modelo de embedding, e exponha duas portas para acessĆ”-los.

  • Implemente o upload contĆ­nuo de arquivos e a comunicação interativa com o mecanismo de chat usando o Streamlit.

  • Document embedding speed Ć© 5 vezes mais rĆ”pida que a API da OpenAI.

  • Utilize os recursos poderosos do GGML para executar o modelo na GPU, garantindo aceleração e reduzindo o tempo de espera pelo retorno.

Código-fonte