Por exemplo, enquanto os artigos GPT-1, GPT-2, GPT-3 e InstructGPT divulgaram os detalhes da arquitetura e do treinamento, a arquitetura GPT-4 é um segredo intimamente guardado.Eu sempre pensei no RLHF como uma abordagem realmente interessante e promissora, mas, além de instrução, chatgpt e llama 2, não foi amplamente utilizado.Por exemplo, pense em tarefas comuns, como classificação de spam de email, categorização de documentos, classificação de análises de clientes e rotulando o discurso tóxico nas mídias sociais.No entanto, semelhante ao LLMS para classificação mencionado acima, também não houve muitos desenvolvimentos na frente do conjunto de dados tabulares, ou eu já estive ocupado demais para perceber.Na minha experiência, é possível obter um bom desempenho de classificação com LLMs “pequenos”, como o Distilbert, usando apenas uma única GPU.
Fonte: https://magazine.sebastianraschka.com/p/ai-and-open-source-in-2023