Obviamente, a abordagem descrita aqui é simples, o SGD não é o modelo mais forte do mercado, mas está fazendo seu trabalho e estabelecendo uma boa linha de base.Embora agora esteja trabalhando como engenheiro de dados, passei uma grande quantidade de minha carreira trabalhando em funções fortemente relacionadas à ciência de dados e aprendizado de máquina.O algoritmo descrito no código pseudo é basicamente:
Portanto, em inglês simples, exatamente o mesmo de antes, mas a etapa de atualização é a média em todo o mini-lote.Portanto, em vez de selecionar aleatoriamente uma amostra do conjunto de treinamento em cada iteração, uma nova iteração é realizada toda vez que uma nova amostra é recebida.Por enquanto, usaremos apenas os recursos contínuos e as primeiras 1000 amostras, pois isso facilitará as coisas.