Mas, conforme explicado no artigo, se todos os clientes falharem ao mesmo tempo, eles voltarão a voltar ao mesmo tempo, depois de um, dois, quatro segundos.Então, no começo, no primeiro erro, você espera 1 segundo antes de voltar, próximos 2 segundos, depois 4 segundos, etc. E se estiver recebendo outro erro, esperará um pouco mais, multiplicando o intervalo por uma constante, como dobrar.Primeiro, discutimos abordagens para consumir APIs da web que são bem-comportadas, expondo cabeçalhos de limitação de taxa,
e aqueles menos bem-comportados usando uma abordagem exponencial de retirada e jitter.A idéia é que, quando você enfrenta um erro de cota acima, vai tentar novamente a chamada depois, por exemplo, um segundo.
Fonte: https://glaforge.dev/posts/2023/10/02/client-side-consumption-of-a-rate-limited-api-in-java/