linux-BR.org

Notícias de software livre e tecnologias

Os concorrentes que superam: Wizardmath se destaca ao superar o ChatGPT-3.5, Claude Instant-1, Palm-2 e Minerva no GSM8K, e ainda se destaca, superando o texto-davinci-002, palm-1 e GPT-3 em benchmarks matemáticos.Raciocínio aprimorado de código: Nosso estudo investiga como o código afeta o raciocínio LLM, ajustando o TEXTIT {Frequência de uso do código} no intérprete de código GPT-4, mostrando suas proezas na geração, execução e avaliação do código.Excelência comprovada: avaliada em relação ao GPT-4, o Shepherd alcança uma taxa média de vitória de 53 a 87% contra os concorrentes, enquanto nas avaliações humanas, o pastor supera outros modelos e rivaliza de perto o desempenho de Chatgpt.Importância do desaprendimento da máquina: desaprendizar a máquina, a capacidade de modelos esquecer informações específicas é crucial para a conformidade com a privacidade de dados e remover dados desatualizados ou prejudiciais.Avanços de LLM no raciocínio matemático: avanços recentes no LLMS como GPT-4 e PALM-2 aumentaram a solução de problemas de matemática, com o intérprete de código GPT-4 destacando os conjuntos de dados difíceis.

Fonte: https://ppdispatch.substack.com/p/chatgpt-is-too-smart-to-be-safe