linux-BR.org

Notícias de software livre e tecnologias

Essa densidade reduzida torna as técnicas de indexação existentes, como as árvores R-Tree, KD e árvores de bola, que dependem da partição do espaço, ineficazes.Especificamente, se tivermos clusters C (centróides), em média, podemos reduzir o número de vetores a serem pesquisados por um fator de 1/c.No PGVector, essa funcionalidade é implementada através do parâmetro `sondas`, que especifica o número de centróides a serem considerados durante a pesquisa, conforme descrito abaixo.Existem inúmeros algoritmos desses, mas neste artigo, nos aprofundaremos no algoritmo de arquivo de arquivo invertido ou IVfflat, que é fornecido pelo PGVector.Com o tempo, isso pode resultar em uma situação em que o agrupamento inicial, estabelecido durante a criação do índice, não representa mais com precisão os dados.

Fonte: https://www.timescale.com/blog/nearest-neighbor-indexes-what-are-ivfflat-indexes-in-pgvector-and-how-do-they-work/