↩︎
É interessante1 + e^x)) xtnh (ln (1 + e x)), respectivamente.Goodfellow, 2016
Na prática, o gerador é frequentemente treinado para maximizar a probabilidade de log D (g (z)) D (G (\ Bold {Z})) D (G (z)) do discriminador estar incorreto (consulte: Tutorial de NIPS 2016: Redes adversárias generativas, Seção 3.2.3).Quanto ao não haver ano 0, proponho definir xxx BCE = 1 -x1 – x1 – x CE, de modo que os anos de BCE são indexados por anos CE (−∞, 0] ( – \ infty, 0] ( – ∞,0]. A contribuição crucial do Alexnet demonstrou o poder das redes mais profundas, pois sua arquitetura era, em essência, uma versão mais profunda das redes anteriores (ou seja, LeNet). [2] É claro que essa lista será sempre subjetiva,Isso não deve ser final, exaustivo ou autoritário.
Fonte: https://bmk.sh/2019/12/31/The-Decade-of-Deep-Learning/