linux-BR.org

Notícias de software livre e tecnologias

Nossa abordagem envolve a) Ingestão de dados e pré-processamento, b) Treinamento de modelo de aprendizado profundo de duas torres, c) construção de índices de milvus e d) pesquisa de similaridade do Milvus.Lembre -se de que o algoritmo IVF_PQ, por meio de sua técnica de quantização, também reduz a pegada de memória e, combinada com a aceleração da GPU, fornece uma solução de pesquisa de Ann viável computacionalmente.Em seguida, demonstramos a construção de um índice simples (ivf_flat) e a consulta contra ele, com as duas funções setup_milvus e query_milvus, respectivamente.As representações vetoriais também podem ser derivadas de várias modalidades de dados, como imagens, vídeos ou descrições textuais de produtos e/ou usuários, usando algoritmos de visão computacional ou modelos de idiomas.Nesses benchmarks, usamos algoritmos de indexação de IVFPQ e HNSW, executados na GPU e CPU, juntamente com várias combinações de parâmetros.

Fonte: https://medium.com/nvidia-merlin/efficient-vector-similarity-search-in-recommender-workflows-using-milvus-with-nvidia-merlin-84d568290ee4