Agora que temos algumas colunas numéricas, podemos usar o explorer.dataframe.describe para obter algumas métricas iniciais como média, contagem, max, min e std.Exgboost oferece 3 booster :: gbtree ,: gblinear e: boosters de dardo.Podemos obter resultados semelhantes usando uma função objetiva diferente ,: Multi_SoftProb, onde o resultado contém probabilidade prevista de cada ponto de dados pertencente a cada classe.De fato, por uma eficiência de velocidade e memória durante a vetorização do TFIDF, vamos remover qualquer entrada cujo comprimento esteja entre os 5% superiores do corpus.Portanto, nesse caso, o conjunto de dados geral de emails é o corpus e um email individual é um documento.
Fonte: https://www.thestackcanary.com/serving-spam-detection-with-xgboost-and-elixir/