Latência da API de benchmarking de provedores de incorporação

7 de abril de 2025 270

E as taxas de erro que observamos mostram que há uma grande sala para melhorias:
OpenAI: 0,05%
Google Vertex AI: 0,002%
Coere: 0,06%
Jina AI: 1,45%
À primeira vista, 0,05% parece pequeno.Mas quando você começa a se preocupar com o desempenho, a latência e a confiabilidade do mundo real, é uma história diferente.Cada provedor parece ter sua própria janela em lote:
Openai e Jina: ~ 300ms
Coere: ~ 100ms
Google: ~ 50ms
Essa diferença no lote explica a maior parte da variação de latência entre os provedores.Como estamos construindo mais um mecanismo de pesquisa © com o NixieSearch, adicionamos recursos de inferência diretamente ao mecanismo de pesquisa.Por exemplo, se um usuário pesquisar “Nike Airmax”, provavelmente deseja documentos que incluam os dois termos exatos.

Fonte: https://nixiesearch.substack.com/p/benchmarking-api-latency-of-embedding

linux-BR.org

Latência da API de benchmarking de provedores de incorporação

Trending posts dos últimos 30 dias

Instalando o Arch Linux

lançado o Blender 4.5 RC1

Nvidia se torna a primeira empresa a valer $ 4 trilhões de dólares americanos

Lançado OpenCL 3.0.19

OpenSuse foi a escolhida

Comentários