Reclassificação#

Aprenda como usar modelos de reordenação no Xinference.

Introdução#

Dada uma consulta e uma série de documentos, o Rerank reordena os documentos do mais relevante para o menos relevante com base na relevância semântica com a consulta. No Xinference, o modelo Rerank pode ser chamado pelo endpoint Rerank para ordenar uma série de documentos.

Guia de Início Rápido#

Podemos usar a API Rerank através do cURL, OpenAI Client ou Xinference:

curl -X 'POST' \
  'http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1/rerank' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "<MODEL_UID>",
    "query": "A man is eating pasta.",
    "documents": [
        "A man is eating food.",
        "A man is eating a piece of bread.",
        "The girl is carrying a baby.",
        "A man is riding a horse.",
        "A woman is playing violin."
    ]
  }'