AI e código aberto em 2023

4 de novembro de 2023 356

Por exemplo, enquanto os artigos GPT-1, GPT-2, GPT-3 e InstructGPT divulgaram os detalhes da arquitetura e do treinamento, a arquitetura GPT-4 é um segredo intimamente guardado.Eu sempre pensei no RLHF como uma abordagem realmente interessante e promissora, mas, além de instrução, chatgpt e llama 2, não foi amplamente utilizado.Por exemplo, pense em tarefas comuns, como classificação de spam de email, categorização de documentos, classificação de análises de clientes e rotulando o discurso tóxico nas mídias sociais.No entanto, semelhante ao LLMS para classificação mencionado acima, também não houve muitos desenvolvimentos na frente do conjunto de dados tabulares, ou eu já estive ocupado demais para perceber.Na minha experiência, é possível obter um bom desempenho de classificação com LLMs “pequenos”, como o Distilbert, usando apenas uma única GPU.

Fonte: https://magazine.sebastianraschka.com/p/ai-and-open-source-in-2023

linux-BR.org

AI e código aberto em 2023

Trending posts dos últimos 30 dias

Instalando o Arch Linux

lançado o Blender 4.5 RC1

Nvidia se torna a primeira empresa a valer $ 4 trilhões de dólares americanos

Lançado OpenCL 3.0.19

RADV Vulkan Video no Mesa 25.2

Comentários