Exemplo: Chatbot de PDF š#
Descrição:
Este exemplo mostra como construir um chatbot de PDF utilizando um LLM local e um modelo de embedding.
Tecnologias envolvidas:
@ Xinference como serviƧo de hospedagem de modelos LLM
@ LlamaIndex usado para orquestrar todo o pipeline RAG
@ Streamlit para interface interativa do usuƔrio
Explicação detalhada sobre a funcionalidade de demonstração:
Foi criado um Dockerfile, que simplifica o processo de implantação por meio do Docker e garante fÔcil reprodutibilidade.
Use o Xinference para iniciar o modelo LLM e o modelo de embedding, e exponha duas portas para acessĆ”-los.
Implemente o upload contĆnuo de arquivos e a comunicação interativa com o mecanismo de chat usando o Streamlit.
Document embedding speed Ʃ 5 vezes mais rƔpida que a API da OpenAI.
Utilize os recursos poderosos do GGML para executar o modelo na GPU, garantindo aceleração e reduzindo o tempo de espera pelo retorno.
- Código-fonte