linux-BR.org

Notícias de software livre e tecnologias

Os grandes modelos de idiomas (LLMs), como o ChatGPT, são capazes de gerar respostas fluentes e semelhantes a muitas tarefas a jusante, por exemplo, diálogo orientado a tarefas e resposta a perguntas.Primeiro, podemos ver que o ChatGPT não fornece uma resposta relacionada a conhecimentos específicos relacionados ao usuário, por exemplo, um restaurante indiano local.Quando olhamos para longe, de perto e de volta, nossos olhos mudam de foco rapidamente para nos permitir perceber as coisas de forma fina e grosseira.Nossos experimentos mostram que, em todas as tarefas, o LLM-Augmenter melhora significativamente a fundamentação do ChatGPT no conhecimento externo sem sacrificar a humanidade de suas respostas geradas.Também revisa iterativamente os avisos do LLM para melhorar as respostas do modelo usando o feedback gerado por funções de utilidade, por exemplo, a pontuação de factualidade de uma resposta gerada por LLM.
Fonte: https://www.microsoft.com/en-us/research/group/deep-learning-group/articles/check-your-facts-and-try-again-improving-large-language-models-with-external-knowledge-and-automated-feedback/