Instalação na NPU Ascend#
Xinference pode ser executado no Ascend NPU, use o seguinte comando para instalar.
Aviso
A versão de código aberto depende do Transformers para inferência, o que pode causar lentidão em chips como o 310p3. Oferecemos uma versão empresarial que suporta o mecanismo MindIE, com desempenho superior e melhor compatibilidade para Ascend NPU. Consulte Xinference Enterprise para mais detalhes.
Instale o PyTorch e a extensão Ascend.#
Instale a versão CPU do PyTorch e a extensão Ascend correspondente.
Usando PyTorch v2.1.0 como exemplo.
pip3 install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cpu
Em seguida, instale a Extensão PyTorch Ascend.
pip3 install 'numpy<2.0' pip3 install decorator pip3 install torch-npu==2.1.0.post3
Execute o seguinte comando para verificar. Se funcionar corretamente, o número de NPUs Ascend será exibido.
python -c "import torch; import torch_npu; print(torch.npu.device_count())"
Instalar o Xinference#
pip3 install xinference
Agora você pode consultar a documentação para usar o Xinference. Transformers é o único mecanismo de código aberto que oferece suporte para NPU Ascend.
Suporte empresarial#
Se você encontrar qualquer problema de desempenho ou outros com a Ascend NPU, entre em contato conosco sobre a versão empresarial do Xinference em aqui.